Pandas bieten Ihnen ein benutzerfreundliches Werkzeug zum Filtern, Umformen, Ändern und Transformieren Ihrer Daten; Sie können Zeilen und Spalten hinzufügen/löschen und erstellen, ähnlich wie in Excel, und unterstützen verschiedene Datentypen. Es benötigt weniger Code. Bewertung gesammelt von und auf G2.com gehostet.
Pandas haben eine sehr steile Lernkurve und werden sehr komplex. Wenn man fortschreitet und tiefer geht, wird es schwieriger zu verstehen, wie diese Bibliothek funktioniert, und auch die Dokumentation ist schlecht. Bewertung gesammelt von und auf G2.com gehostet.
Das Beste an Pandas ist die Kompatibilität mit Datensätzen, die Sie als Excel-Dateien, CSV, JSON manipulieren können. Sie können auch Listen oder SQLAlchemy-Datenrahmen verarbeiten. Dieser Teil der Daten mit Pandas ist sehr wichtig, wenn Sie sie beispielsweise an eine Webseite senden möchten. Bewertung gesammelt von und auf G2.com gehostet.
Schemas zu verstehen ist schwierig, denn wenn man beispielsweise ein SQLAlchemy-DataFrame konvertiert, das bereits ein definiertes Schema hat, ignoriert Pandas es vollständig und fasst alles in einem zusammen. Man muss es selbst definieren, und das ist eine mühsame, aber nicht unmögliche Aufgabe. Bewertung gesammelt von und auf G2.com gehostet.
Ich finde Pandas am besten für Datenverarbeitung und -analyse. Mit so vielen Funktionen und Methoden ermöglicht Pandas die Verarbeitung und Analyse von Daten nach unseren Bedürfnissen. Mein Lieblingsteil ist die Verwendung von groupby mit einer Lambda-Funktion, um eine detaillierte Analyse zu erhalten. Bewertung gesammelt von und auf G2.com gehostet.
Es ist schwer, Pandas nicht zu mögen, wenn man es in jedem seiner Projekte und Datenarbeiten verwendet. Aber dennoch unterstützt Pandas die parallele Verarbeitung nicht so sehr wie PySpark. Das ist ein Nachteil, aber es ist trotzdem mehr als vorteilhaft. Bewertung gesammelt von und auf G2.com gehostet.
Pandas ist eine großartige Möglichkeit, mit tabellarischen Daten zu arbeiten. Ich schätze die C++-Implementierungen, die eine performante Manipulation von Daten in Python ermöglichen. Es gibt auch ausgezeichnete Möglichkeiten, die Daten zu visualisieren. Bewertung gesammelt von und auf G2.com gehostet.
Ich finde einige der Indexierungssemantiken sehr verwirrend. Die Verwendung von .loc, [Spaltenname] ist redundant und gibt in einigen Implementierungen Warnungen. Ich wünschte, dies wäre einfacher. Bewertung gesammelt von und auf G2.com gehostet.
Mit Pandas können wir Daten leicht manipulieren, wie z.B. sortieren, strukturieren, Daten zusammenführen, etc. Dateien wie CSV oder andere lesen, in diesem Fall ist Pandas besser als die Verwendung von Dateifunktionen. Bewertung gesammelt von und auf G2.com gehostet.
Sie haben viele Daten zu dieser Zeit, nicht sichtbar als Eigenschaft, verwenden einige Funktionen und Pandas haben nicht zu viele Visualisierungsdiagramme, die eine andere Bibliothek verwenden und nicht für unstrukturierte Daten verwenden. Bewertung gesammelt von und auf G2.com gehostet.
Sehr nützlich für jede Art von Data-Science/Machine-Learning-Pipeline. Vektorisierte Funktionen erleichtern das Bearbeiten der Tabellen erheblich und funktionieren gut mit allen Arten von Tabellendaten (csv, txt, etc.). Bewertung gesammelt von und auf G2.com gehostet.
Es kann eine sehr steile Lernkurve haben, was bedeutet, dass neue Benutzer Schwierigkeiten haben, auf die gesamte Palette der angebotenen Funktionen zuzugreifen. Es kann auch schwierig sein, genau zu verstehen, was beim Gruppieren/Filtern vor sich geht. Bewertung gesammelt von und auf G2.com gehostet.
Pandas ist das beste Python-Framework, das ich höchstwahrscheinlich vor dem maschinellen Lernprozess für die Datenbereinigung und Datenübersicht verwende, wo wir Nullwertbehandlung, Ausreißerbehandlung und für die angemessene Erstellung von Daten durchführen. Bewertung gesammelt von und auf G2.com gehostet.
Ich mag Pandas nicht, weil es für uns einfach sein wird, wenn wir Datenvorverarbeitung durchführen, und wir verwenden einige in Pandas integrierte Funktionen, die es einfach machen, Code ohne manuelle Logik zu schreiben. Bewertung gesammelt von und auf G2.com gehostet.
Es ist sehr flexibel im Umgang mit großen Datenmengen und bietet dem Analysten/Datenwissenschaftler große Unterstützung bei der Durchführung grundlegender täglicher Operationen, die in der Industrie meist verwendet werden. Bewertung gesammelt von und auf G2.com gehostet.
Die Dokumentation ist gut für ein grundlegendes Verständnis, aber wenn man tiefer gehen muss, ist die Dokumentation nicht so großartig oder leicht zu finden. Auch für höhere Dimensionen wird Pandas nicht die richtige Wahl sein und der Analyst/Datenwissenschaftler muss andere Bibliotheken verwenden. Bewertung gesammelt von und auf G2.com gehostet.
Was mir am meisten am Pandas-Framework für Python gefällt, ist die Benutzerfreundlichkeit und die umfangreiche Dokumentation. Derzeit hat Pandas, als Erweiterung von Numpy, eine der besten möglichen Dokumentationen. Bewertung gesammelt von und auf G2.com gehostet.
Selbst bei guter Dokumentation besteht das Hauptproblem von Python (und damit von Pandas) darin, dass die Berechnungseffizienz verbessert werden muss. Manchmal ist es etwas langsam. Bewertung gesammelt von und auf G2.com gehostet.
Pandas bietet viele vorgefertigte Funktionen, um Daten zu modifizieren und zu bearbeiten, eine der am häufigsten verwendeten Bibliotheken im Bereich der Datenwissenschaft. Pandas ist dank pip (Paketinstallationsprogramm von Python) einfach zu installieren. Bewertung gesammelt von und auf G2.com gehostet.
Pandas ist in der Tat eine großartige Bibliothek, aber es gibt eine Lernkurve, die ein wirklich großes Problem für Anfänger darstellt. Auch die Dokumentation ist nicht gut geschrieben, sodass es schwierig ist, sich auf die offizielle Dokumentation zu beziehen und damit zu arbeiten. Bewertung gesammelt von und auf G2.com gehostet.