Dieser Beitrag ist Teil von G2s 2021 Digital Trends Serie. Lesen Sie mehr über G2s Perspektive zu digitalen Transformationstrends in einer Einführung von Michael Fauscette, G2s Chief Research Officer, und Tom Pringle, VP, Marktforschung, sowie zusätzliche Berichterstattung über Trends, die von G2s Analysten identifiziert wurden.
Auf der einen Seite: Gute Akteure, die synthetische Daten nutzen
Wir leben im Zeitalter der Daten. Unternehmen suchen nach Möglichkeiten, die von ihnen gesammelten Daten zu nutzen, um fundiertere Geschäftsentscheidungen zu treffen. Regierungsorganisationen, die historisch gesehen langsam in der Innovation waren, versuchen beispielsweise, die von ihnen gesammelten Daten besser zu verstehen, um ihren Bürgern bessere Pflege und Unterstützung zu bieten.
Organisationen suchen nach Wegen, Daten zu nutzen, während sie: |
|
Häufig reichen altmodische Data-Masking-Software und De-Identifikationssoftware nicht aus, um sicherzustellen, dass die oben genannten Punkte eingehalten werden. Sie riskieren entweder, die Daten-Nützlichkeit zu zerstören, indem sie Datensätze produzieren, die statistisch nicht mit dem Original vergleichbar sind (Verstoß gegen #1), oder sie erlauben es, Personen innerhalb der Daten zu identifizieren (Verstoß gegen #2).
true"bg-light"{}{}"Was ist Data-Masking-Software und De-Identifikationssoftware?""Flex - Blog Text Callout Box 2"4171269"Data-Masking-Software schützt die wichtigen Daten einer Organisation, indem sie sie mit zufälligen Zeichen oder anderen Daten verschleiert. De-Identifikationssoftware ersetzt persönliche Identifikationsdaten in Datensätzen durch künstliche Kennungen oder Pseudonyme."
In den letzten Jahren hat G2 den Aufstieg von synthetischen Daten beobachtet, sowohl unstrukturiert als auch strukturiert, die Unternehmen Werkzeuge bieten, um programmgesteuert Datensätze zu erstellen, die statistisch identisch sind, aber keine tatsächlichen Daten oder PII enthalten. Wir haben gesehen, dass sogar Regierungsorganisationen, wie Die Nationale Sicherheitskommission für Künstliche Intelligenz, die Bedeutung dieser Art von Daten erkennen, wie sie durch Partnerschaften mit Verkäufern und Berichten zum Ausdruck gebracht haben.
VORHERSAGE
Im nächsten Jahr erwartet G2 ein stetiges Wachstum der Anzahl der Anbieter im Bereich synthetischer Daten sowie neuartige Anwendungen der Technologie, da das Wissen über ihre Auswirkungen und Bedeutung zunimmt.
Obwohl synthetische Daten verschiedener Art seit Jahrzehnten existieren, erleben wir in den letzten Jahren einen Boom des Interesses und Fortschritte in den Techniken. Tatsächlich wurden über 71% der 21 Unternehmen in G2s Synthetische Daten Software Kategorie seit 2017 gegründet, wie unten zu sehen ist.
Die positiven Anwendungsfälle von synthetischen Daten sind vielfältig und spannend, mit einem enormen Einfluss auf die Industrie. Wenn man eine Branche aus einem (sehr großen) Hut zieht, stehen die Chancen gut, dass es einen Anwendungsfall für synthetische Daten gibt, der einen Einfluss haben kann.
Gesundheitswesen
Jasmine Lee, G2-Analystin mit Fokus auf Gesundheitswesen, hat die Attraktivität und die realen Konsequenzen von der Anwendung von synthetischen Daten auf sensible klinische Daten hervorgehoben. Sie schreibt:
Sobald synthetische Datenlösungen in die Datenbanken einer Gesundheitsorganisation integriert sind, werden alle Datenpunkte erfasst, die Datenbereinigung und -deduplizierung automatisiert, statistische Erkenntnisse und Beziehungen zwischen Datenpunkten erfasst und der Datenaustausch, die Bereitstellung und das Modellieren erleichtert.
Autonome Fahrzeuge
Im Bereich der autonomen Fahrzeuge arbeiten Unternehmen mit synthetischen Datenunternehmen zusammen, um robustere Trainingssätze zu erstellen. Traditionelle Methoden zur Schulung dieser Fahrzeuge sind mit Schwierigkeiten behaftet, von den Kosten für den Aufbau eines großen und diversifizierten Datensatzes von Szenarien bis hin zur Gefahr von Unfällen. Mit synthetischen Daten können Hersteller autonomer Fahrzeuge programmgesteuert Datensätze erstellen, die mit der realen Welt vergleichbar sind. Mit einem angemessenen Datensatz sind diese Fahrzeuge darauf ausgelegt, sicherer und zuverlässiger zu sein.
Finanzen
Im Bereich der Finanzdienstleistungen nutzen Unternehmen synthetische Daten, um Finanzdaten zu teilen und zu analysieren. Beispielsweise können Unternehmen Kundeninformationen, einschließlich Kreditbewertungen, erweitern. Mit synthetischen Daten können sie Muster und Beziehungen in transaktionalen Zeitreihendaten bewahren. Die Anwendungen in der realen Welt umfassen: Modellierung komplexer kausaler und zeitlicher Beziehungen in Transaktionsflüssen und Aufbau von Kreditrisikosystemen.
Konkrete Beispiele umfassen:
- Im Gesundheitswesen, haben die National Institutes of Health mit MDClone zusammengearbeitet, um die Forschung zu COVID-19-Daten zu erleichtern.
- Im Bereich der autonomen Fahrzeuge, hat CVEDIA SynCity entwickelt, um eine Simulationsplattform bereitzustellen, die zur Generierung von Daten für das Training und die Validierung von neuronalen Netzwerken verwendet wird. Diese Plattform kann verwendet werden, um Computersichtsysteme für autonome Fahrzeuge mit benutzerdefinierten, fotorealistischen Simulationen zu validieren.
- Im Bereich der Finanzdienstleistungen, Hazy spezialisiert sich auf Finanzdienstleistungen und hilft bereits einigen der weltweit führenden Banken und Versicherungsunternehmen, das Compliance-Risiko zu reduzieren und die Dateninnovation zu beschleunigen.
Auf der anderen Seite: Schlechte Akteure, die synthetische Daten nutzen
Allerdings ist nicht alles rosig im Bereich der synthetischen Daten. In den letzten Jahren haben wir einen Anstieg der böswilligen Nutzung von synthetischen Medien, insbesondere in Form von Deepfakes, einer Art von synthetischen Medien, die in Form von Text, Bildern, Audio oder Video auftreten können, beobachtet. Am häufigsten denken Menschen an Deepfakes, wenn ein Bild oder Video mit dem Abbild einer anderen Person manipuliert wird.
Unten kann man sehen, wie das Interesse an diesem Bereich relativ niedrig geblieben ist, abgesehen von den beiden Spitzen Anfang 2018 und Mitte 2018, als der Begriff erstmals verwendet wurde.
Deepfakes unterscheiden sich in ihrer Raffinesse, wobei einige Versionen besonders amateurhaft und schlampig sind, während andere sehr schwer zu erkennen sind. Was alarmierend ist, ist, dass diese Art von synthetischen Medien nur fortschrittlicher und zunehmend schwerer zu erkennen wird. Dieser Trend wird auch durch die folgenden Faktoren befeuert:
- Deepfakes-as-a-Service: Einige böswillige Akteure bieten an, jedem Einzelnen ein maßgeschneidertes Deepfake zu verkaufen, sodass sie jede Art von Medien für den richtigen Preis erstellen können.
- Fehlinformationen für den Verlust: Böswillige Akteure können Deepfake-Videos über soziale Medien verbreiten und gefälschtes Filmmaterial als echt präsentieren.
VORHERSAGE
In Zukunft erwarten wir mehr Investitionen in die Erkennung von Deepfakes sowohl von Cybersicherheitsfirmen als auch von Medienorganisationen. Im Hinblick auf letztere wird dies wahrscheinlich sowohl durch interne Innovation und Talent als auch durch strategische Investitionen befeuert.
Es gibt jedoch Hoffnung
Alles ist nicht verloren. Wie oben erwähnt, haben Regierungen sowohl die guten als auch die schlechten Seiten von synthetischen Daten zur Kenntnis genommen. Abgesehen von den positiven Anwendungen von synthetischen Daten, die wir oben gesehen haben, investiert der US-Kongress auch in Lösungen zur Bekämpfung von Deepfakes und arbeitet aktiv daran, das Gespräch voranzutreiben.
Wir haben auch ein starkes Interesse von Cybersicherheitsfirmen und sozialen Medienorganisationen gesehen, böswillige synthetische Medien durch Wettbewerbe und Datenwissenschaftslabore zu bekämpfen.
Merry Marwig, G2-Analystin mit Fokus auf Datenschutz und Cybersicherheit, bemerkte:
„G2 hat (noch) keine Kategorie für Deepfakes und andere Arten der Desinformationsdetektion, aber wir behalten diesen Markt 2021 genau im Auge.“
Bearbeitet von Sinchana Mistry
Möchten Sie mehr über Bildverarbeitungssoftware erfahren? Erkunden Sie Bilderkennung Produkte.

Matthew Miller
Matthew Miller is a research and data enthusiast with a knack for understanding and conveying market trends effectively. With experience in journalism, education, and AI, he has honed his skills in various industries. Currently a Senior Research Analyst at G2, Matthew focuses on AI, automation, and analytics, providing insights and conducting research for vendors in these fields. He has a strong background in linguistics, having worked as a Hebrew and Yiddish Translator and an Expert Hebrew Linguist, and has co-founded VAICE, a non-profit voice tech consultancy firm.