Pandas te ofrece una herramienta fácil de usar para filtrar, remodelar, modificar y transformar tus datos; puedes añadir/eliminar y crear filas y columnas, al igual que en Excel, y admite diferentes tipos de datos. Necesita menos codificación. Reseña recopilada por y alojada en G2.com.
Los pandas tienen una curva de aprendizaje muy pronunciada y se vuelven muy complejos. A medida que avanzas y profundizas, las cosas se vuelven más difíciles de entender cómo funciona esta biblioteca, y también una documentación deficiente. Reseña recopilada por y alojada en G2.com.
Lo mejor de pandas es la compatibilidad con conjuntos de datos que puedes manipular como archivos de excel, csv, json, también puedes manejar listas o dataframes de sqlalchemy, es muy importante esta parte de los datos con pandas si quieres enviarlos para llamarlos en otro lugar, por ejemplo, una página web. Reseña recopilada por y alojada en G2.com.
los esquemas finales, es difícil entenderlos porque si conviertes, por ejemplo, un dataframe de sqlalchemy que ya tiene un esquema definido, pandas lo ignora completamente y lo pone todo en uno, debes definirlo tú mismo y eso es una tarea tediosa pero no imposible. Reseña recopilada por y alojada en G2.com.
Encuentro que pandas es lo mejor de lo mejor para el procesamiento y análisis de datos. Con tantas funciones y métodos, pandas permite procesar y analizar datos según nuestras necesidades. Mi parte favorita es usar groupby con una función lambda para obtener un análisis detallado. Reseña recopilada por y alojada en G2.com.
Es difícil no gustar de pandas cuando lo usas en cada uno de tus proyectos y trabajos de datos. Pero aún así, pandas no soporta el procesamiento paralelo tanto como lo hace pyspark. Esa es una desventaja, pero aún así es más que beneficioso. Reseña recopilada por y alojada en G2.com.
Pandas es una excelente manera de trabajar con datos tabulares. Realmente aprecio las implementaciones en C++ que permiten una manipulación eficiente de datos en Python. También hay excelentes formas de visualizar los datos. Reseña recopilada por y alojada en G2.com.
Encuentro que algunas de las semánticas de indexación son muy confusas. Las formas de usar .loc, [colname] son redundantes y generan advertencias en algunas implementaciones. Desearía que esto fuera más sencillo. Reseña recopilada por y alojada en G2.com.
Usando Pandas podemos manipular datos fácilmente como ordenar, estructurar formularios, fusionar datos, etc. Leer cualquier archivo como csv u otro en ese momento es mejor usar Pandas que las características de archivo. Reseña recopilada por y alojada en G2.com.
Tienes muchos datos en ese momento, no es visible el uso de algunas funciones y pandas no tiene demasiados gráficos de visualización que usan otra biblioteca y no se utilizan para datos no estructurados. Reseña recopilada por y alojada en G2.com.
Muy útil para cualquier tipo de pipeline de ciencia de datos/aprendizaje automático. Las funciones vectorizadas facilitan mucho la edición de las tablas y funcionan bien con todo tipo de datos tabulares (csv, txt, etc.). Reseña recopilada por y alojada en G2.com.
Puede tener una curva de aprendizaje muy pronunciada, lo que significa que los nuevos usuarios tienen problemas para acceder a toda la gama de funciones ofrecidas. También puede ser difícil entender exactamente qué está sucediendo al agrupar/filtrar. Reseña recopilada por y alojada en G2.com.
Pandas es el mejor marco de Python que probablemente use antes del proceso de aprendizaje automático para la limpieza de datos y la visión general de los datos, donde manejamos valores nulos, tratamos los valores atípicos y creamos datos de manera adecuada. Reseña recopilada por y alojada en G2.com.
No me desagradan los pandas porque será fácil para nosotros cuando hagamos el preprocesamiento de datos, y usamos algunas funciones integradas de pandas, lo que facilita hacer el código sin ninguna lógica manual. Reseña recopilada por y alojada en G2.com.
Es muy flexible en el manejo de grandes datos y proporciona una gran ayuda al Analista/Científico de Datos para realizar operaciones básicas del día a día que se utilizan principalmente en la industria. Reseña recopilada por y alojada en G2.com.
La documentación es buena para una comprensión básica, pero si necesitas profundizar, la documentación no es tan buena ni fácil de encontrar. Además, para dimensiones más altas, pandas no será la elección correcta y el analista/científico de datos tendrá que usar otras bibliotecas. Reseña recopilada por y alojada en G2.com.
Lo que más me gusta del framework de pandas para python es la facilidad de uso y su gran documentación. Actualmente, siendo pandas una extensión de numpy, tiene una de las mejores documentaciones posibles. Reseña recopilada por y alojada en G2.com.
Aún teniendo una buena documentación, el principal problema que tiene python (por lo consiguiente pandas), es que deben mejorar la eficiencia de cálculo. A veces suele ser un poco lento. Reseña recopilada por y alojada en G2.com.
Pandas ofrece muchas características preconstruidas para modificar y jugar con datos, una de las bibliotecas más utilizadas en el ámbito de la ciencia de datos, pandas es fácil de instalar gracias a pip (el instalador de paquetes de Python). Reseña recopilada por y alojada en G2.com.
Pandas es de hecho una gran biblioteca, pero hay una curva de aprendizaje que es un problema realmente grande para los principiantes, además la documentación no está bien escrita, por lo que es difícil referirse y trabajar con la documentación oficial. Reseña recopilada por y alojada en G2.com.