
Als Dateningenieur, der in den letzten zwei Jahren mit Databricks gearbeitet hat, kann ich ehrlich sagen, dass die Plattform die Herangehensweise an Dateningenieurprojekte komplett verändert hat. Vor Databricks standen mein Team und ich oft vor Herausforderungen bei der Verwaltung großer Datensätze und der Sicherstellung einer reibungslosen Zusammenarbeit zwischen Dateningenieuren und Datenwissenschaftlern. Es gab Zeiten, in denen sich Arbeitsabläufe unzusammenhängend anfühlten, und das Beheben von Problemen über verschiedene Tools hinweg nahm viel Zeit in Anspruch.
Databricks hat all das verändert. Besonders das Feature der kollaborativen Notebooks war ein Wendepunkt. Ich kann jetzt nahtlos in Echtzeit mit Datenwissenschaftlern zusammenarbeiten, Probleme beheben und Lösungen viel schneller iterieren. Zum Beispiel konnten wir während eines kürzlichen Projekts ein maschinelles Lernmodell innerhalb von Tagen verfeinern, dank der Möglichkeit, Notebooks einfach zu teilen und schnell gemeinsam Experimente durchzuführen. Diese Art der Zusammenarbeit dauerte früher mit anderen Tools Wochen.
Das Auto-Scaling-Feature war ein Lebensretter. Ich erinnere mich lebhaft an die Leistungsprobleme, die wir beim Verarbeiten großer Datensätze auf unserer alten Infrastruktur hatten. Jetzt passt Databricks die Ressourcen automatisch basierend auf der Arbeitslast an, sodass wir uns nie um die Verwaltung der Rechenleistung kümmern müssen. Dies hat die Verarbeitungszeiten drastisch verkürzt. Zum Beispiel dauert ein Datenumwandlungsjob, der früher Stunden in Anspruch nahm, jetzt nur noch einen Bruchteil der Zeit, was es uns ermöglicht, Projekte schneller zu liefern.
Delta Lake war ebenfalls von unschätzbarem Wert. Bevor wir es nutzten, waren Datenkonsistenz und -qualität ständige Sorgen, besonders beim Umgang mit großen und vielfältigen Datenquellen. Jetzt können wir mit Delta Lake darauf vertrauen, dass unsere Daten nicht nur von hoher Qualität, sondern auch leicht zugänglich und abfragbar sind. Ein besonderes Beispiel war, als wir eine komplexe Datensatz-Pipeline neu aufbauen mussten. Delta Lake ermöglichte es uns, mit inkrementellen Datenaktualisierungen zu arbeiten, was den Prozess viel effizienter und zuverlässiger machte.
Kurz gesagt, Databricks hat die Entwicklungszeit erheblich reduziert und die Gesamtqualität unserer Lieferungen verbessert. Es hat mir geholfen, komplexe Arbeitsabläufe zu straffen, die Zusammenarbeit zwischen Teams zu verbessern und vor allem datengetriebene Lösungen schneller und mit größerem Vertrauen zu liefern. Bewertung gesammelt von und auf G2.com gehostet.
Kostenoptimierung - Während ich die detaillierten Abrechnungsinformationen schätze, kann die Vorhersage von Kosten für große Projekte oder geteilte Umgebungen immer noch undurchsichtig erscheinen. Viele Teams kämpfen damit, unkontrollierte Kosten durch inaktive Cluster oder suboptimale Konfigurationen zu kontrollieren. Die Einführung intelligenterer Autoskalierung und Empfehlungen, die auf unsere Workloads zugeschnitten sind, wäre von unschätzbarem Wert. Zum Beispiel könnten Warnungen für "inaktive Cluster" oder "Kosten-Hotspots" in unserer Umgebung proaktiv Budgets sparen und die Effizienz verbessern.
Vereinfachte Governance und Sicherheit - Das Verwalten des Zugriffs auf feingranularer Ebene kann umständlich sein. Zum Beispiel erfordert die Kontrolle darüber, wer ein Notebook oder einen Job ansehen oder ausführen kann, oft Umgehungslösungen. Audit-Logs sind ausgezeichnet, aber sie für umsetzbare Erkenntnisse zu verstehen, fühlt sich manchmal wie das Lösen eines Puzzles an. Verbesserte attributbasierte Zugriffskontrolle (ABAC) und intuitivere, UI-basierte Steuerungen für das Berechtigungsmanagement würden die Abläufe erheblich vereinfachen.
Benutzererfahrung - Die kollaborative Notebook-Oberfläche ist eines der herausragenden Merkmale von Databricks, doch es gibt Bereiche, in denen sie reibungsloser sein könnte. Die Zusammenarbeit wird manchmal behindert, wenn zwei Benutzer dasselbe Notebook bearbeiten. Die Versionskontrolle wirkt im Vergleich zu Git-basierten Systemen grundlegend. Das Debuggen innerhalb von Notebooks, insbesondere für nicht-Python-Workloads, könnte erheblich verbessert werden. Das Hinzufügen von Inline-Kommentaren, Konfliktlösungswerkzeugen und robusten Debugging-Funktionen würde die Plattform auf die nächste Stufe heben. Ein Aktivitäts-Feed auf Workspace-Ebene, um zu zeigen, was in gemeinsamen Projekten passiert, wäre ebenfalls äußerst hilfreich. Bewertung gesammelt von und auf G2.com gehostet.
609 Databricks Data Intelligence Platform Bewertungen
Databricks glänzt darin, Datenengineering, Analytik und KI/ML auf einer einzigen Plattform zu vereinen. Die Lakehouse-Architektur überbrückt die Lücke zwischen Data Lakes und Data Warehouses und macht es unglaublich effizient, strukturierte und unstrukturierte Daten zu verwalten. Ich schätze besonders die nahtlose Integration mit Apache Spark, die robuste Notebook-Unterstützung für kollaborative Entwicklung und die Einfachheit von Delta Lake für versionierte Datenspeicherung. Funktionen wie AutoML und Unity Catalog vereinen Governance und Intelligenz, was es einfacher macht, Analysen sicher und zuverlässig zu skalieren. Bewertung gesammelt von und auf G2.com gehostet.
Obwohl die Plattform leistungsstark ist, gibt es eine Lernkurve – insbesondere für Teams, die mit Spark oder verteiltem Rechnen nicht vertraut sind. Einige Funktionen (wie Unity Catalog oder serverloses Rechnen) können regionsspezifisch oder durch die Kompatibilität des Cloud-Anbieters eingeschränkt sein. Darüber hinaus kann das Debuggen von Jobs und das Kostenmanagement von Clustern ohne sorgfältige Überwachung und Kennzeichnung, insbesondere bei Projekten im Unternehmensmaßstab, herausfordernd sein. Bewertung gesammelt von und auf G2.com gehostet.

Was mir an Databricks am besten gefällt, ist die nahtlose Integration von Big-Data-Verarbeitung und KI. Die auf Notebooks basierende Benutzeroberfläche erleichtert die Zusammenarbeit, und die Verwendung von Spark sorgt für schnelle Leistung. Delta Lake bietet zudem zuverlässige Datenversionierung und -verwaltung, was in Unternehmensumgebungen äußerst hilfreich ist. Bewertung gesammelt von und auf G2.com gehostet.
Ein Nachteil ist, dass die anfängliche Einrichtung und Netzwerkkonfiguration komplex sein können und technisches Fachwissen erfordern. Auch können die Kosten je nach Nutzung schnell ansteigen, daher ist eine Kostenüberwachung unerlässlich. Darüber hinaus kann das Fehlen umfassender Dokumentation in einigen Sprachen wie Japanisch eine Einschränkung darstellen. Bewertung gesammelt von und auf G2.com gehostet.

Was mir an den Databricks-Datenintelligenzplattformen am besten gefällt, ist die nahtlose Integration von Data Engineering, Data Science und KI-Workflows auf einer einzigen Plattform, die die Zusammenarbeit, Robustheit und Leistung für große Daten- und ML-Projekte verbessert. Bewertung gesammelt von und auf G2.com gehostet.
Der am wenigsten nützliche Aspekt der Databricks-Datenintelligenzplattform ist ihre Komplexität für neue Benutzer und die steile Lernkurve, insbesondere für diejenigen ohne starken Hintergrund in Spark oder verteiltem Rechnen. Darüber hinaus kann sie in großem Maßstab teuer sein, und das Debuggen großer Workflows kann manchmal aufgrund begrenzter Transparenz bei der Fehlerverfolgung herausfordernd sein. Bewertung gesammelt von und auf G2.com gehostet.
Ich mag es, weil es sich durch seine Fähigkeit auszeichnet, Data Science, Data Engineering und Business Analytics in einer einzigen Schnittstelle zu vereinen. Ich schätze auch die nahtlose Integration mit kollaborativen Notebooks und die Fähigkeit, nahtlos mit Delta Lake zu arbeiten, was ebenfalls ein großer Pluspunkt ist, da es Zuverlässigkeit und Leistung bei der Verwaltung von groß angelegten Daten gewährleistet. Bewertung gesammelt von und auf G2.com gehostet.
Manchmal kann die Weboberfläche eine Weile dauern, um aktive Cluster zu laden. Ich hätte auch gerne mehr visuelle Werkzeuge, um die Ressourcennutzung in Echtzeit zu überwachen. Bewertung gesammelt von und auf G2.com gehostet.

Die Databricks Data Intelligence Platform ermöglicht es uns, eine einzige Quelle für Entwicklungsmöglichkeiten für IT-Entwickler und Business-Analysten zu haben. Dies erleichtert die Implementierung von Funktionen und die Konsolidierung von Werkzeugen in der gesamten Umgebung. Den Nutzern wird die Freiheit gegeben, die Datenprodukte zu entwickeln, die sie in den benötigten Zeitrahmen benötigen. Es erleichtert die Implementierung und Produktionalisierung dieser Projekte für die nachgelagerte Nutzung erheblich. Bewertung gesammelt von und auf G2.com gehostet.
Das einzige "Missfallen", das ich habe, ist, dass es schwierig ist, mit all den Verbesserungen und Erweiterungen der Plattform Schritt zu halten. Wir sehen immer neue Funktionen, die implementiert werden sollen, und wollen sicherstellen, dass wir unser Bestes für unsere Endbenutzer tun. Bewertung gesammelt von und auf G2.com gehostet.

Databricks ist sehr zuverlässig, flexibel und hilft unserem Unternehmen, innovative analytische Lösungen zu schaffen. In unseren wöchentlichen technischen Meetings behandeln wir eine Vielzahl von Themen wie Bugs, Best Practices, neue Funktionen und mehr, indem wir es nutzen. Auch jedes Mitglied des Support-Teams bei Databricks reagiert schnell und ist ziemlich hilfsbereit. Bewertung gesammelt von und auf G2.com gehostet.
Bei der Nutzung kreativer Funktionen wie KI kann die Kostenkontrolle und -schätzung schwierig sein. Und obwohl Lakeview SQL noch nicht entwickelt ist, treibt Databricks dennoch aktiv deren Nutzung voran. Außerdem überrascht mich gelegentlich die unangekündigte Aktivierung von Funktionen in meinem Büro. Bewertung gesammelt von und auf G2.com gehostet.
Arbeiten mit Databricks, wo wir problemlos riesige Datensätze analysieren und unsere Plattform oder Website integrieren können, um Einblicke aus unserem internen Datensatz zu gewinnen. Sie haben eine Reihe von Funktionen, die uns helfen, alle analytischen Ansichten mit vordefinierten Vorlagen zu verwalten. Bewertung gesammelt von und auf G2.com gehostet.
Die Implementierung war so schnell und einfach, dass sie uns hilft, alle Daten ohne Probleme zu verwalten. Ich mag ihren Kundensupport und ihre häufige Nutzung macht sie zu meiner Lieblingsplattform für Datenmanagement. Bewertung gesammelt von und auf G2.com gehostet.

Der Unity-Katalog bündelt nützliche Datentypen wie Tabellen (Delta), Modelle, Ansichten, Funktionen und Volumes (für unstrukturierte Daten). Zusätzlich optimiert die Workflows-Registerkarte die Effizienz, um Jobs und Pipelines auszuführen, die mit Big Data aktualisieren und interagieren. Bewertung gesammelt von und auf G2.com gehostet.
Die schlechteste Funktionalität kommt mit den Berechnungsmodi und den eingeschränkten Fähigkeiten. Zum Beispiel ist der dedizierte Einzelbenutzermodus unerlässlich, um ML-Laufzeiten und einige Spark-Kontextzugriffe zu nutzen; jedoch ist der Standard-Shared-Access-Modus entscheidend für die neueste UC-Funktionalität, wie z.B. die ordnungsgemäße Nutzung von Shallow Clones. Bewertung gesammelt von und auf G2.com gehostet.
Die Plattform von Databricks ist ein leistungsstarkes kollaboratives Werkzeug, das es Teams ermöglicht, nahtlos an Datenprojekten zusammenzuarbeiten. Die integrierte Umgebung für Datenverarbeitung und -analyse sowie die benutzerfreundliche Oberfläche erleichtern es, Erkenntnisse zu visualisieren und Ergebnisse in Echtzeit zu teilen. Bewertung gesammelt von und auf G2.com gehostet.
Die gelegentliche Komplexität bei der Verwaltung mehrerer Cluster und Umgebungen kann zu Verwirrung hinsichtlich der Ressourcenzuweisung führen. Darüber hinaus kann die Lernkurve für neue Benutzer steil sein, was die organisatorische Einführung zu einer Herausforderung macht. Bewertung gesammelt von und auf G2.com gehostet.

Ich habe teilgenommen, um zu erkunden, wie Databricks Datenengineering, Analytik und KI vereint. Die Integration der Plattform mit BI-Tools und die Unterstützung für Delta Lake funktionierten gut. Die Leistungs- und Kollaborationsfunktionen stachen hervor. Allerdings könnten die Lernkurve und einige UI-Komplexitäten für neue Benutzer, die von traditionellen Plattformen wechseln, verbessert werden. Bewertung gesammelt von und auf G2.com gehostet.
Ich habe an der Sitzung zur Databricks Data Intelligence Platform teilgenommen, fand sie jedoch eher unspektakulär. Die Funktionen und die Leistung waren weder herausragend noch enttäuschend. Es fühlte sich generisch an, mit vagen Verbesserungen und minimaler Innovation. Insgesamt bin ich unsicher über die besonderen Vorteile, was meine Bewertung weder besonders informativ noch umsetzbar für potenzielle Nutzer macht. Bewertung gesammelt von und auf G2.com gehostet.