Pandas vous offre un outil convivial pour filtrer, remodeler, modifier transformer vos données ; vous pouvez ajouter/supprimer et créer des lignes et des colonnes, comme dans Excel, et prendre en charge différents types de données. Il nécessite moins de codage. Avis collecté par et hébergé sur G2.com.
Les pandas ont une courbe d'apprentissage très abrupte et deviennent très complexes. À mesure que vous progressez et approfondissez, les choses deviennent plus difficiles à comprendre comment cette bibliothèque fonctionne, et aussi une documentation médiocre. Avis collecté par et hébergé sur G2.com.
La meilleure chose à propos de pandas est la compatibilité avec les ensembles de données que vous pouvez manipuler sous forme de fichiers excel, csv, json, vous pouvez également gérer des listes ou des dataframes sqlalchemy, cette partie des données avec pandas est très importante si vous souhaitez les envoyer pour les appeler ailleurs, par exemple sur une page web. Avis collecté par et hébergé sur G2.com.
ult schémas, il est difficile de les comprendre car si vous convertissez par exemple un dataframe sqlalchemy qui a déjà un schéma défini, pandas l'ignore complètement et met tout dans un seul, vous devez le définir vous-même et c'est une tâche fastidieuse mais pas impossible. Avis collecté par et hébergé sur G2.com.
Je trouve que pandas est le meilleur des meilleurs pour le traitement et l'analyse des données. Avec tant de fonctions et de méthodes, pandas permet de traiter et d'analyser les données selon nos besoins. Ma partie préférée est d'utiliser groupby avec une fonction lambda pour obtenir une analyse détaillée. Avis collecté par et hébergé sur G2.com.
Il est difficile de ne pas aimer pandas quand on l'utilise dans chacun de ses projets et travaux de données. Mais pandas ne prend toujours pas en charge le traitement parallèle autant que pyspark. C'est un inconvénient, mais cela reste tout de même très avantageux. Avis collecté par et hébergé sur G2.com.
Pandas est un excellent moyen de travailler avec des données tabulaires. J'apprécie vraiment les implémentations en C++ qui permettent une manipulation performante des données en python. Il existe également d'excellentes façons de visualiser les données. Avis collecté par et hébergé sur G2.com.
Je trouve certaines des sémantiques d'indexation très déroutantes. Les manières d'utiliser .loc, [colname] sont redondantes et donnent des avertissements dans certaines implémentations. Je souhaite que cela soit plus simple. Avis collecté par et hébergé sur G2.com.
Avec Pandas, nous pouvons facilement manipuler des données comme le tri, la structuration, la fusion des données, etc. Lire n'importe quel fichier comme csv ou autre, à ce moment-là, pandas est meilleur que d'utiliser les fonctionnalités de fichier. Avis collecté par et hébergé sur G2.com.
Vous avez beaucoup de données à ce moment-là, pas de propriété visible, utilisez une fonction et pandas n'ont pas trop de graphiques de visualisation, utilisez une autre bibliothèque et ne pas utiliser pour les données non structurées. Avis collecté par et hébergé sur G2.com.
Très utile pour tout type de pipeline de science des données/apprentissage automatique. Les fonctions vectorisées facilitent l'édition des tableaux et fonctionnent bien avec toutes sortes de données tabulaires (csv, txt, etc.) Avis collecté par et hébergé sur G2.com.
Cela peut avoir une courbe d'apprentissage très abrupte, ce qui signifie que les nouveaux utilisateurs ont du mal à accéder à l'ensemble des fonctionnalités offertes. Il peut également être difficile de comprendre exactement ce qui se passe lors du regroupement/filtrage. Avis collecté par et hébergé sur G2.com.
Pandas est le meilleur cadre Python que j'utilise très probablement avant le processus d'apprentissage automatique pour le nettoyage des données et l'aperçu des données, où nous traitons les valeurs nulles, le traitement des valeurs aberrantes et pour créer des données de manière appropriée. Avis collecté par et hébergé sur G2.com.
Je n'aime pas les pandas car il sera facile pour nous lorsque nous faisons le prétraitement des données, et nous utilisons certaines fonctions intégrées de pandas, ce qui facilite l'écriture de code sans aucune logique manuelle. Avis collecté par et hébergé sur G2.com.
Il est très flexible dans la gestion de grandes données et offre une grande aide à l'analyste/scientifique des données pour effectuer des opérations de base au quotidien qui sont principalement utilisées dans l'industrie. Avis collecté par et hébergé sur G2.com.
La documentation est bonne pour une compréhension de base mais si vous avez besoin d'aller plus loin, la documentation n'est pas si excellente ou facile à trouver. De plus, pour des dimensions plus élevées, pandas ne sera pas le bon choix et l'analyste/data scientist devra utiliser d'autres bibliothèques. Avis collecté par et hébergé sur G2.com.
Ce que j'aime le plus dans le framework pandas pour python, c'est la facilité d'utilisation et sa grande documentation. Actuellement, étant pandas une extension de numpy, il a l'une des meilleures documentations possibles. Avis collecté par et hébergé sur G2.com.
Même avec une bonne documentation, le principal problème de Python (et donc de pandas) est qu'ils doivent améliorer l'efficacité du calcul. Parfois, il peut être un peu lent. Avis collecté par et hébergé sur G2.com.
Pandas offre de nombreuses fonctionnalités préconstruites pour modifier et manipuler les données, l'une des bibliothèques les plus utilisées dans le domaine de la science des données, pandas est facile à installer grâce à pip (gestionnaire de paquets de python). Avis collecté par et hébergé sur G2.com.
Pandas est en effet une excellente bibliothèque mais il y a une courbe d'apprentissage qui est un très gros problème pour les débutants, aussi la documentation n'est pas bien écrite donc il est difficile de se référer et de travailler avec la documentation officielle. Avis collecté par et hébergé sur G2.com.