Moderne intelligente Software basiert auf den unterschiedlichsten neuen Technologien. Was aber ist der Unterschied zwischen Artificial Intelligence (AI), Machine Learning und Deep Learning? Was hat es mit Big Data auf sich? Und was macht eigentlich ein Data Scientist? In unserem Blogbeitrag erklären wir, was hinter den Begriffen steckt, wie sie zusammenhängen und wie intelligente Software in Unternehmen eingesetzt werden kann.
Artificial Intelligence (AI)
Artificial Intelligence, auch Künstliche Intelligenz oder KI, ist genau das, was der Begriff sagt: Eine Intelligenz, wie wir sie von Menschen und Tieren kennen, künstlich mit Computern nachgebildet. Klingt simpel, ist aber ein hochkomplexes Thema. Noch immer sind sich Wissenschaftler und Philosophen nicht einig, was Intelligenz konkret ist - geschweige denn, wie man eine künstliche Form erschaffen kann.
Allgemeine Intelligenz nachzubilden liegt noch in weiter Ferne. Aber sie lässt sich in verschiedene Teilbereiche zerlegen. Denken, Problemlösung, Planung, Lernen, Sprechen, Sehen: All das sind Ausprägungen von Intelligenz. Und für jede dieser Ausprägungen gibt es ein entsprechendes Pendant innerhalb von AI, um so menschliche Fähigkeiten zu digitalisieren.
Machine Learning
Ein wichtiger - und der wahrscheinlich bekannteste - Bereich innerhalb von AI ist Machine Learning. Hierbei geht es darum, die Lernfähigkeit des Menschen zu imitieren.
Als Menschen lernen wir ständig aus Situationen in unserem täglichen Leben. Ein Beispiel: Wenn ein Kind eine Katze sieht und die Eltern „Katze“ sagen und dies auch bei anderen Katzen immer wieder wiederholen, wird das Kind mit der Zeit lernen, Katzen zu erkennen.
Machine Learning funktioniert auf ganz ähnliche Weise. Das System wird mit zahlreichen Beispielen von Katzenbildern und der Beschreibung „Katze“ gefüttert. Während des Trainings lernt das System, was all diese Bilder gemeinsam haben. Zeigen Sie dem System danach das Bild einer Katze, die es noch nicht gesehen hat, wird es die Katze auch auf diesem Bild erkennen.
Zugegeben, die Erkennung von Katzen wird für die meisten Unternehmen wohl eher wenig interessant sein. Das grundlegende Konzept von Mustererkennung, dem Treffen von Vorhersagen und der Automatisierung von Entscheidungsprozessen lässt sich jedoch auf zahlreiche Business Use Cases anwenden, beispielsweise zur Entwicklung eines Prognosemodells, das die Wahrscheinlichkeit von Folgekäufen ermittelt.
Damit lassen sich potenzielle Kunden noch gezielter ansprechen und die Abschlussquote wird signifikant erhöht. Dies ist somit auch eine wertvolle Information für Vertrieb, Marketing oder Kundenservice.
Deep Learning
Ein wichtiger Teil von Machine Learning sind (künstliche) neuronale Netze, welche der Funktionsweise des menschlichen Gehirns nachempfunden sind. Das Gehirn besteht aus einem Netzwerk von miteinander verbundenen Neuronen, den Gehirnzellen, die sich gegenseitig elektrische Impulse übermitteln.
Analog dazu besteht ein künstliches neuronales Netzwerk aus künstlichen Neuronen, die Eingaben von anderen Neuronen empfangen und Ausgaben an andere Neuronen weitergeben können.
Die Neuronen in einem künstlichen neuronalen Netzwerk sind normalerweise in Schichten angeordnet. Es gibt eine Eingabeschicht, eine oder mehrere Zwischenschichten (versteckte Schichten) sowie eine Ausgabeschicht:
Verfügt das Netzwerk über eine große Anzahl von versteckten Schichten, so spricht man von Deep Learning. In den letzten zehn Jahren hat Deep Learning zu großen Fortschritten in der AI geführt, u.a. in Bereichen wie Objekterkennung, Spracherkennung, Qualitätssicherung, Betrugserkennung oder der medizinischen Diagnostik.
Deep Learning ist eine spezielle Technik im Rahmen des Machine Learning (daneben gibt es noch weitere). Machine Learning wiederum ist ein Teilbereich von Artificial Intelligence. Bildlich kann man sich das in etwa so vorstellen:
In diesem Kontext sind auch zwei weitere Begriffe relevant: Big Data und Data Science.
Big Data
Big Data beschreibt eine Datensammlung, die zu groß oder zu komplex ist, um sie mit einem traditionellen Datenbankmanagementsystem zu verarbeiten, beispielsweise wenn im Rahmen von Machine Learning hunderttausende von Fotos analysiert werden sollen. Insbesondere Deep Learning eignet sich gut, um Big Data-Probleme zu bewältigen.
In der Praxis werden Big Data-Techniken eingesetzt, sobald das Machine Learning-System aufgrund von Einschränkungen, wie zu geringem Speicher oder Prozessorleistung, nicht mehr auf einem Computer ausgeführt werden kann. Die Lösung besteht darin, die Deep Learning-Software auf Computerclustern in einem Rechenzentrum laufen zu lassen. Die Aufgabe wird so verteilt und parallel von mehreren Computern ausgeführt.
Data Lake
In der sich ständig weiterentwickelnden Welt der Artifical Intelligence, des Machine Learnings und des Deep Learnings spielen Daten eine entscheidende Rolle. Eine der Schlüsseltechnologien zur Verwaltung dieser Daten ist der Data Lake.
Ein Data Lake ist eine zentrale Speicherstätte, in der Daten in ihrem ursprünglichen Format aufbewahrt werden, unabhängig von Quelle und Struktur. Dies ist besonders wichtig für Machine Learning und Deep Learning, da diese Technologien von großen Datenmengen lernen.
Im Data Lake tauchen sie dann sozusagen ein, um Muster zu erkennen, Prognosen zu erstellen und schlussendlich intelligentere Systeme zu entwickeln. Durch die Speicherung von Daten in einem Data Lake können AI, Machine Learning und Deep Learning auf ein breiteres Spektrum von Informationen zugreifen und so effektiver arbeiten.
Data Science
Und was versteht man unter Data Science? Bei Data Science handelt es sich um ein interdisziplinäres Fachgebiet, das wissenschaftliche Methoden und Algorithmen einsetzt, um Wissen aus großen Datensammlungen zu gewinnen und Probleme in den unterschiedlichsten Anwendungsbereichen zu lösen.
Die Abbildung oben zeigt, dass Data Science große Überschneidungen mit AI und speziell mit Machine Learning hat. Dazu gehören der Bereich Big Data sowie Teile von Deep Learning. Data Science umfasst aber auch Aspekte, die über das Thema AI hinausgehen.
Was macht ein Data Scientist?
Welche Aspekte das genau sind, wird verständlicher, wenn man sich die Kompetenzen eines Data Scientist anschaut. Diese lassen sich in vier Bereiche unterteilen:
- AI: Kenntnisse über maschinelles Lernen und verwandte Techniken sowie über statistische Modelle und damit verbundene Mathematik.
- Informatik: Kenntnisse in Programmiersprachen wie Python und R, Datenbanken wie SQL und NoSQL und Cloud-Implementierungen.
- Branchen- und Fachwissen: Wissen über den geschäftlichen Kontext der Anwendungen, in denen AI-Probleme löst.
- Kommunikation: Fähigkeit, datengetriebene Erkenntnisse mithilfe von Data Storytelling zu erklären und zu visualisieren.
Anwendungsbeispiel: Erkennung von Verunreinigungen
Ein Abfallverarbeitungsunternehmen möchte eine AI-basierte Kamera entlang seiner Förderbänder einsetzen, um Verunreinigungen zu identifizieren. Der Data Scientist nutzt sein Fachwissen, um die Aufgabe des Unternehmens in ein algorithmisches Problem zu übersetzen.
Er setzt sein Wissen über AI ein, um mit Deep Learning ein Modell auf Bilder von sauberen und verunreinigten Plastikströmen zu trainieren. Dafür schreibt er einen Code in Python, den er auf einer Cloud-Plattform ausführt. Die Ergebnisse visualisiert er mithilfe seiner Kommunikationsfähigkeiten.
Von Daten zu konkreten Aktionen
Unternehmen nutzen schon seit langem die Möglichkeiten von Business Intelligence – zum Beispiel in Form von Berichten oder interaktiven Dashboards. Diese Erkenntnisse beschränken sich in der Regel jedoch auf die Vergangenheit: Was ist passiert und warum? Zudem sind immer noch viele manuelle Prozesse erforderlich, bei denen die Benutzer Entscheidungen selbst treffen müssen.
Advanced Analytics und vor allem AI gehen noch um einiges weiter. Sie ermöglichen einen Blick in die Zukunft. Die Ergebnisse sind Prognosen (Was wird passieren?) und Empfehlungen (Was sollte ich tun?). Für die Ableitung konkreter Aktionen sind kaum noch manuelle Prozesse und Entscheidungen notwendig. Die ausgereifteste Form der AI automatisiert auch diese letzten menschlichen Schritte und führt vollautomatisch Aktionen auf Grundlage von Daten durch.
Sie wollen wissen, wie auch Sie Business Intelligence in Ihrem Unternehmen sinnvoll einsetzen können?
Unsere Experten unterstützen Sie gerne dabei, Ihr Unternehmen zukunftsfit zu machen. Jetzt kontaktieren!