Die wichtigste Voraussetzung zur Nutzung von Künstlicher Intelligenz (KI) ist die Digitalisierung des Unternehmens. Mit der Digitalisierung ergeben sich jedoch neue, zusätzliche Herausforderungen. Plötzlich fallen viele Daten an, die gespeichert werden müssen. Für den Einsatz von KI-Technologien ist es von großer Bedeutung, auf strukturierte Daten zugreifen zu können.
Was sind strukturierte Daten und wie lassen sie sich speichern?
Strukturierte Daten besitzen eine identifizierbare Struktur. Ein Beispiel sind gespeicherte Personendaten mit dem Namen, der Anschrift, dem Wohnort, etc. Ein anderes Beispiel sind Produkte mit ihren Eigenschaften, wie Kategorie, Größe, Gewicht, Preis, etc. Strukturiert sind Daten also dann, wenn sie organisiert und somit direkt abrufbar für eine Software vorliegen. Unstrukturierte Daten sind beispielsweise Bilder, Videos, Scans, E-Mails, Texte oder andere Objekte, die nicht in einer Datenbank gespeichert werden können. Allerdings können auch diese Daten bis zu einem bestimmten Punkt strukturiert werden, indem sie mit sog. Labels versehen werden. Labels des Inhalts eines Urlaubsvideo könnten beispielsweise sein: Sommer, Sonne, Strand, Ort, Aktivitäten, Sehenswürdigkeiten. Schon können auch diese ursprünglich unstrukturierten Daten zum Teil von KI-Systemen verwendet werden. In vielen Unternehmen liegen die meisten Daten unstrukturiert vor. Dies ist jedoch kein Grund den Kopf in den Sand zu stecken! Die KI-Technologien entwickeln sich ständig weiter, so dass immer mehr Verfahren existieren, die aus unstrukturierten Daten die wichtigsten Informationen zur weiteren Verarbeitung extrahieren können.
Warum ist der Aufbau einer Datenbank und das strukturierte Speichern der Daten wichtig?
Liegen Daten strukturiert vor, können diese direkt aus der Datenbank ausgelesen und für KI-Technologien nutzbar gemacht werden. Dies bringt trotz des höheren Initialaufwands durch den Aufbau einer geeigneten Datenbank enorme Zeit- und Kostenvorteile. Ein KI-Expertenteam muss die Daten sonst nämlich im Nachhinein für die KI nutzbar machen, was hohe Zeit- und Kostenaufwände bedeutet, da die Nutzbarmachung von Daten bei jeder Umsetzung eines Projekt mit Abstand die meiste Zeit in Anspruch nimmt. Deshalb sollte im Zuge der Digitalisierung das Speichern von Daten von vornherein mitgedacht werden!
Welche Datenbanken existieren und wie kann ich sie im Unternehmen einsetzen?
Es existieren kostenfreie Open-Source-Datenbanken wie PostgresSQL, SQLite, MogoDB für große Datenmengen und viele weitere mehr. Außerdem gibt es viele kommerzielle Lösungen von namhaften Anbietern mit entsprechendem Support. Welche Datenbank für ein bestimmtes Unternehmen am besten geeignet ist, lässt sich gemeinsam mit dem Mittelstand 4.0 - Kompetenzzentrum Cottbus herausfinden.
Um die Datenbanken einsetzen zu können, benötigt ein Unternehmen entweder eine eigene IT-Infrastruktur oder eine Cloud-Lösung. Der Vorteil einer eigenen IT-Infrastruktur ist die volle Kontrolle über die eigenen Daten. Die Nachteile sind die potentiell höheren Kosten durch die Anschaffung der Server und der Speicher, die mit Redundanzsystemen ausgestattet sein müssen, um im Fall eines Ausfalls eines Servers oder Speichers eine Rückfalloption zu haben, die den laufenden Geschäftsbetrieb nicht lahmlegt. Weiterhin wird qualifiziertes Personal benötigt, das sich um den reibungslosen Ablauf der IT-Infrastruktur und vor allem die Sicherheit der Systeme kümmert. Die Vorteile einer Cloud-Lösung liegen in der größeren Flexibilität durch Skalierbarkeit und das Auslagern der Wartungs- und Sicherheitskosten an externe Anbieter. Die Skalierbarkeit stellt sicher, dass der Cloud-Speicher mit den steigende Datenmengen des Unternehmens mitwächst. Außerdem können KI-Technologien mittlerweile in diesen Cloud-Diensten ausgeführt werden. Die Rechenleistung wird ebenso gemietet wie der Speicher, wodurch es für Unternehmen möglich ist mit relativ wenig Personal für IT und KI größere IT-Infrastrukturen und KI-Modelle zu managen.
Welche Anforderungen an die Rechenleistung stellen KI-Technologien?
Diese Frage kann nicht eindeutig beantwortet werden. Generell gilt, je größer und komplexer die KI-Modelle werden, desto mehr Rechenleistung wird benötigt. Vor allem das Deep-Learning benötigt hoch spezialisierte Grafikkarten zur Ausführung der zahlreichen Rechenoperationen beim Training der KI-Modelle. Andererseits kann es bei dem Einsatz anderer KI-Methoden zunächst ausreichen handelsübliche Computer zu verwenden. Dies ist z.B. bei simpleren Zeitreihenanalysen oder bestimmten Klassifikationen möglich. Die benötigte Rechenleistung kann wie der Speicher an externe Cloud-Dienste ausgelagert werden. Die Vorteile sind sie Skalierbarkeit bei wachsenden Anforderungen an die Hardware sowie state-of-the-art Grafikkarten und parallelisierte Server, die die Berechnungen deutlich beschleunigen.
Haben Sie keine Bedenken vor dem Einsatz von KI in Ihrem Unternehmen! Fangen Sie mit kleineren Projekten an und lassen Sie sich von den Vorteilen intelligenter Systeme überzeugen. Das Mittelstand 4.0-Kompetenzzentrum Cottbus unterstützt Sie dabei gern!
Über den Autor: Sascha Vökler ist KI-Trainer im Mittelstand 4.0 - Kompetenzzentrum Cottbus. Er forscht an der Weiterentwicklung von Machine-Learning-Algorithmen für verschiedene Einsatzbereiche. Außerdem gründete er 2014 ein Software-Start-up, das Machine-Learning in der Marktforschung einsetzte. Des Weiteren ist er als selbständiger Data Scientist tätig.