Pandas es el mejor marco de Python que probablemente use antes del proceso de aprendizaje automático para la limpieza de datos y la visión general de los datos, donde manejamos valores nulos, tratamos los valores atípicos y creamos datos de manera adecuada.
Lo mejor de pandas es la compatibilidad con conjuntos de datos que puedes manipular como archivos de excel, csv, json, también puedes manejar listas o dataframes de sqlalchemy, es muy importante esta parte de los datos con pandas si quieres enviarlos para llamarlos en otro lugar, por ejemplo, una página web.
Lo que más me gusta del framework de pandas para python es la facilidad de uso y su gran documentación. Actualmente, siendo pandas una extensión de numpy, tiene una de las mejores documentaciones posibles.