Was ist Data Mining und wie funktioniert es

Auf einen Blick:

Data Mining beschreibt die Verarbeitung von großen, ungeordneten Datenmengen (Big Data) mithilfe von mathematischen und statistischen Methoden. Data Mining ist ein Teilbereich des Machine Learning und wurde durch die immer größer werdenden Datenmengen im Zuge der Digitalisierung notwendig. Das Prinzip des Data Minings versucht Zusammenhänge zwischen Datensätzen zu erkennen. Dafür werden beim Data Mining verschiedene Methoden verwendet.

Inhalt

Was ist Data Mining?

Data Mining beschreibt die Verarbeitung von großen, ungeordneten Datenmengen (Big Data) mithilfe von mathematischen und statistischen Methoden. Data Mining ist ein Teilbereich des Machine Learning und wurde durch die immer größer werdenden Datenmengen im Zuge der Digitalisierung hervorgebracht. Das Prinzip des Data Mining versucht Zusammenhänge zwischen Datensätzen zu erkennen. Dafür werden beim Data Mining verschiedene Methoden verwendet. Es gibt die Klassifikation, Assoziation, Segmentierung und Prognose. Durch diese verschiedenen Methoden werden verwertbare, strukturierte Informationen aus ungeordneten Datensätzen gewonnen.

Wie funktioniert Data Mining?

Das Data Mining bedient sich verschiedener mathematischer und statistischer Methoden, um Zusammenhänge aus Datensätzen zu generieren. Generell lässt sich sagen, dass Data Mining vier Methoden nutzt und diese auch miteinander kombiniert werden können. Es gibt die Methoden “Klassifikation”, “Assoziation”, “Segmentierung” und “Prognose”. Die Klassifikation ist dabei die Zuordnung von Daten zu einer bestimmten Klasse. Diese Zuordnung wird aufgrund von Entscheidungsregeln getroffen. Klassen können z.B. das Alter oder die Steuerklasse von Personen sein. Bei der Assoziation werden Zusammenhänge nach bestimmten Regeln geprüft. Ein Beispiel dafür ist, wie oft an einem Imbiss mit einer größeren Auswahl die Kombination Currywurst und Bier gekauft wird. Wenn diese Kombination häufig gekauft wird kann man eine Assoziationsregel zwischen Currywurst und Bier aufstellen. Die Segmentierung beschreibt die Bildung von Gruppen aufgrund von Ähnlichkeiten. Betrachtet man zum Beispiel alle Personen auf einem Marktplatz, kann ein Segment gebildet werden für alle Frauen, die eine Handtasche tragen und alle Männer, die Zeitung lesen. Die Prognose gibt Auskunft über eine mögliche zukünftige Entwicklung. Dabei werden durch Vergangenheits- oder Erfahrungswerte Entwicklungen prognostiziert. Hier könnte durch die Betrachtung von Börsenkursen Annahmen über deren möglichen zukünftigen Verlauf getroffen werden.

Beispiele für Data Mining:

Im Marketing wird Data Mining zum genaueren Festlegen einer Zielgruppe oder eines Kundensegments verwendet. Medienhäuser verwenden Data Mining, und RadiohörerInnen und FernsehzuschauerInnen personalisiertere Empfehlungen zu geben. Die Gesundheitsökonomie wird durch Data Mining unterstützt, indem genauere Diagnosen getroffen werden können durch den Vergleich mit ähnlichen Patienten.

Data Mining in der Zukunft

Der Trend der zunehmenden Datenmenge wird weiterhin bestehen. Damit wird auch Data Mining weiter nötig und wichtig sein. Die Datenmengen werden so groß werden, dass vermutlich die Prozessorenleistung, die zur Analyse der Daten notwendig ist, an ihre Grenzen kommt.

Inhalt:

Kontakt: Medienbüro Mendack
Mail: sm@mb-mendack.de | Tel.: 0211 4360344

Newsletter

Verpassen Sie keine neuen Inhalte und interessante Informationen rund um das Thema KI.