Big Data einfach erklärt – Warum sind Datenmengen so zukunftsrelevant?

Auf einen Blick ⤵

Big Data (deutsch „große Datenmengen“) ist schnell erklärt. Sie ist die Grundlage, das „Futter“ für Analysen mittels Computer, also für Data Science, KI, Machine Learning, Computer Vision und vieles mehr. Diese großen Datenmengen entstehen u.a. durch Smartphones, die Bewegungs- und Nutzungsdaten der NutzerInnen sammeln und für Analysen verfügbar machen. Ohne Big Data keine KI, ohne KI keine Assistenzsysteme für Menschen.

Das ist es:

Big Data (deutsch „große Datenmengen“) ist schnell erklärt. Sie ist die Grundlage, das „Futter“ für Analysen mittels Computer, also für Data Science, KI, Machine Learning, Computer Vision und vieles mehr. Diese großen Datenmengen entstehen u.a. durch Smartphones, die Bewegungs- und Nutzungsdaten der NuterInnen sammeln und für Analysen verfügbar machen. Ohne Big Data keine KI, ohne KI keine Assistenzsysteme für Menschen. Die DSGVO, also die Datenschutzverordung in Europa schränkt die Möglichkeit, diese Daten zu analysieren, allerdings ein – und zwar stärker als etwa die Datenschutzverordnung der USA oder Chinas. Vereinfacht gesagt erlaubt die DSGVO die Analyse von personenbezogenen Daten nur, wenn derjenige aktiv zugestimmt hat. Und zwar jedes Mal wieder. Das verhindert weitestgehend in Europa das verknüpfte Analysieren von Daten, etwa die Kombination von Daten auf dem Smartphone mit z.B. Daten von Google oder Facebook zu dieser Person. Das ist z.B. in China anders. Big Data sind also auch in Europa Grundlage von KI und Co. – allerdings können sie hier nicht so umfänglich analysiert werden wie in anderen Ländern.

So funktioniert es:

Big Data meint einfach nur das Sammeln von strukturierten oder unstrukturierten Daten als Grundlage für Analysen, z.B. im Bereich Data Science oder durch Künstliche Intelligenz. Da unsere technischen Möglichkeiten immer besser werden, Daten zu sammeln und zu speichern, werden die Grundlagen für die genannten Analysemethoden immer besser.

Aktuell werden vor allem Daten von Smartphones und dem Internet genutzt und analyisert. Laut Kai Fu Lee (Buch: AI-Superpowers: China, Silicon Valley und die neue Weltordnung) ist das aber erst die erste Welle von KI und Co. Er nennt diese Welle die „Internet-KI“: UserInnen bewegten sich online, eine KI könne dadurch Daten sammeln und interpretieren. Die für ein lernendes System notwendigen „Output“-Orientierungen seien beispielsweise „hat geklickt“ versus „hat nicht geklickt“, „hat gekauft“ versus „hat nicht gekauft“, „war lange auf einer Seite“ versus „war nicht lange auf einer Seite“. Endprodukte seien dabei z.B. das Empfehlungsmarketing, „User, die diesen Artikel angesehen haben, haben sich auch für diesen Artikel interessiert“. Die KI lerne persönliche Vorlieben des Users, die sie online verfolgen könne. Daraus ergebe sich über die Verweilzeit ein besseres Empfehlungsmarketing – eine Entwicklung, die UserInnen erkennen können als eine „Verbesserung des Internets“ (S. 107). Eine Kombination von Online- und Offline-Verhalten erfolge dabei aber noch nicht.

Beispiele für Big Data:

Überall dort, wo Daten gesammelt werden, fallen „Big Data“ an:

  • Kameras am Bahnhof
  • Bewegungs- und Nutzungsdaten des Smartphones
  • Wetterdaten
  • Kassenbons von Supermärkten
  • Kreditkarten

Big Data in der Zukunft

Big Data ist gut, Smart Data ist besser. In der nächsten Phase nutze Kai Fu Lee zufolge eine KI nicht die Daten, die online entstehen, sondern die vorliegenden Daten von Wirtschaftsunternehmen mit dem Ziel, das jeweilige Unternehmen weiterzuentwickeln. Auch hier ist eine sinnvolle Analyse und ein Lernen der KI nur möglich, wenn die Daten in strukturierter Form vorliegen, zahlreich sind und ein gewünschter Output gelabelt werden kann. Nicht jedes Unternehmen und nicht alle Industrien haben diese Datenqualität, so dass anzunehmen ist, dass nur bestimmte Firmen KI hier sinnvoll nutzen können. Ein Beispiel dafür ist der Finanzbereich, und hierbei sind es vor allem kreditgebende Unternehmen, denn für diese ist das Ausfallrisiko und damit ein Verlust des Kreditgeldes sehr hoch. Wer einen Kredit beantragt, muss eine Vielzahl von Angaben über sich, seine Familie und seine Vermögensverhältnisse preisgeben. Kreditunternehmen haben damit strukturierte Kundendaten. Und sie verfügen über die wichtige Output-Variable, nämlich „Kreditausfall“ versus „Kredit zurückgezahlt“. Eine KI kann damit lernen und berechnen, mit welcher Wahrscheinlichkeit ein Kreditbeantragender ausfällt – und zwar VOR dem Abschluss des Kreditvertrages. Daraufhin können Kreditunternehmen entscheiden, ob sie z.B. den Zins anheben, um das Risiko besser abzusichern oder ob sie AnwärterInnen von vornherein ablehnen. Big Data und KI werden also weiter Einzug in neue Bereiche unseres Lebens halten.

European wholesale study 2020 l Digital Transformation in B2B The role of AI and Pricing Automation
Künstliche Intelligenz im Marketing 2018 – SRH Berlin University/Kaiserscholle
Künstliche Intelligenz im Marketing 2019 – SRH Berlin University/Kaiserscholle
Künstliche Intelligenz im Marketing 2021 – SRH Berlin University/Kaiserscholle