Dialoggesteuerte Chatbots als Konversations-KI
Seit der Antike ist uns der Platonische Dialog[1] bekannt. Der griechische Philosoph Platon (427 - 347 v.Chr.) wählte eine Dialogform, um die Wahrheit über die Welt zu finden. Er nimmt uns auf eine Reise durch fiktive Gespräche von zwei bis vier Diskutierenden mit, mit dem Ziel einer gemeinsamen Untersuchung.
In der Renaissance führte Galileo Galilei (1564 - 1642) den „Dialog über die beiden hauptsächlichsten Weltsysteme“[2] ein. Wir spüren Galileis Gedankenwelt, wobei er ins Kreuzfeuer der katholischen Kirche und der Inquisition geriet.
1 https://de.wikipedia.org/wiki/Platonischer_Dialog
2 https://www.buecher.de/shop/fachbuecher/dialog-ueber-die-beiden-hauptsaechlichen-weltsysteme/galilei-galileo/products_products/detail/prod_id/22510017/
„Das Lesen eines schönen Buches ist ein ununterbrochener Dialog, in dem das Buch spricht und unsere Seele antwortet.“ Dieser Satz von André Maurois[3] (französischer Schriftsteller und Literaturwissenschaftler), der vermutlich Platons Aussage „Denken ist der Dialog der Seele mit sich selbst.“ als Vorbild genommen hat, wird zukünftig Realität. Der neue Chatbot übernimmt die Funktion des Dialogpartners, der Zugriff auf das unerschöpfliche und weiterhin anwachsende Wissen des Internets hat und individuell an den Dialogpartner angepasste Persönlichkeit annimmt.
Welche Technologien werden benötigt, um einen Chatbot als Dialogpartner oder als Konversations-KI zu entwickeln? Unter den fünf wesentlichen Bestandsteilen einer Konversations-KI kann man ASR (Automatische Spracherkennung – Speech Recognition), NLU (Natural Language Understanding), ML (Machine Learning), NLG (Natural Language Generation), TTS (Text-To-Speech) betrachten (s. Abbildung 1).
Als Erstes empfängt der dialogbasierter Chatbot die Daten von einem Menschen entweder durch Text- oder Spracheingabe. Durch die Verwendung der automatischen Spracherkennung (ASR) ist der Chatbot in der Lage, gesprochene Wörter zu verstehen und in Text zu übersetzen.
3 https://beruhmte-zitate.de/zitate/2003694-platon-denken-ist-der-dialog-der-seele-mit-sich-selbst/ link
Als nächstes muss mithilfe von Natural Language Understanding (NLU) ermitteln werden, was dieser Text bedeutet. Hierbei spricht man von einer Äußerung (Utterance) bei der gelieferten Anfrage und von einer Intention (Intent) in einer Konversation. Die Konversations-KI verwendet maschinelles Lernen (ML), um Korrekturen zu akzeptieren und aus jeder Erfahrung zu lernen. Durch diesen Prozess werden zukünftige Antworten immer besser und genauer. Durch Dialogverwaltung wird eine passende Antwort auf den Text formuliert. Dabei wird Natural Language Generation (NLG) verwendet.
Als letzten Schritt kann die Antwort als Text, z.B. auf einer Webseite oder als Sprache, wie es Amazon Alexa, Google Assistent, Apple Siri oder Microsoft Cortana ausgegeben werden.
Unterschied Regelbasierter Chatbot versus KI-basierte Chatbots
Viele denken heute noch, dass Chatbots einfache Frage-Antwort-Roboter sind, die eingegebene Texte oberflächlich analysieren. Basierend auf gefundenen Stichwörtern versuchen Chatbots passende Antworten zu geben. Dies sollte in der Vergangenheit den FAQ Bereich automatisieren damit sich Kunden nicht durch lange FAQ Listen quälen und Aftersales-Mitarbeiter nicht immer die gleichen Antworten geben müssen. Es besteht jedoch oft noch das Problem, dass die Chatbots falsche Stichwörter analysieren und falsche, ungenügende Antworten oder gar keine Antworten liefern. Diese Probleme waren mit regelbasierten Chatbots verbunden. Die regelbasierten Chatbots verwenden ein Baumdiagramm, um auf die vordefinierten Fragen die entsprechenden Antworten zu liefern.
Neueste selbstlernende Chatbot-Konzepte, oder auch “Conversational AI – Konversations-KI” sind jedoch wesentlich intelligenter und analysieren neben Texteingaben auch Spracheingaben. Mittels einer Künstlichen Intelligenz KI ist möglich, Text-/Spracheingaben wesentlich besser zu verarbeiten und dadurch präzisere Aussagen liefern zu können. Die “KI” kann im Web nach Antworten suchen, die bereits vorhanden sind. Somit “lernen” heutige Chatbots mit ihren Anforderungen.
Ein dialogorientierter Chatbot kann jeden Aspekt davon verändern, wann, wo und wie Unternehmen mit Menschen interagieren. Die Bereitstellung bietet eine neue Kategorie von Funktionen, die Führungskräfte berücksichtigen müssen, wenn sie ihre Kunden und Stakeholder bedienen.
Als Firmen-Wikipedia kann der neue Chatbot integriert werden, um auf das gesamte Unternehmenswissen zugreifen zu können. Man kann ihn sich auch als Schnittstelle zu Kunden für FAQ und gleichzeitig Input für Kundenanforderungen und zukünftige Produktmerkmale bei der Produktentwicklung vorstellen. Diese Prozesse werden heute immer noch durch aufwendige und teure Marktrecherchen erledigt.
Eine neue Studie (10.08.2021) zu den Anwendungen der Sprachtechnologien ist unter diesem Link zu finden.
https://www.ki.nrw/studie-moderne-sprachtechnologien/ link
Die Zukunft ist nah
Als Vision sehe ich die Möglichkeit, dass man zukünftig nicht nur ein Buch liest, sondern in einem Dialog mit einem Buch/Hörbuch bleibt und Fragen zum jeweiligen Kapitel oder zu einer entsprechenden Aussage stellen kann.
Eine neue effektivere Welt des Lernens kann entstehen im Makroskopischen. Auf mikroskopischer Ebene, kann diese Methode als Wikipedia- Wissensdatenbank für Unternehmen betrachtet werden sowie Kunden-Unternehmen-Dialoge steuern. Durch die Chatbot-Technologie entsteht ein vernetztes Wissensökosystem mit dem großen Vorteil, dass das Wissen einfach abrufbar ist.Ein Ökosystem besteht aus einer Lebensgemeinschaft von Organismen mehrerer Arten. Durch die neu vorgeschlagene Aufnahme der KI als Lebensart[4], entsteht ein neues Wissensökosystem. Das ist ein dynamische-komplex lebendes System, das auf einer Zusammenarbeit und aufeinander beeinflussenden Entwicklung der Menschen-Maschine Symbiose basiert. Als großartiges Beispiel ist hier Googles Projekt LaMDA[5] zu nennen, das auf neuronaler Netztarchitektur von Transformers basiert und natürlich gestaltete Gespräche mit Unternehmenskunden bietet.
”Google” selbst ist heute der bekannteste Chatbot, der basierend auf Stichwörter die relevantesten Suchergebnisse präsentiert. Das ist auch der Grund weshalb Google sehr viel in “Conversational AI” investiert, um zukünftige Suchergebnisse in einen Dialog zu wandeln, damit die Suchergebnisse noch effizienter und präziser erscheinen.
Ein anderes Beispiel ist Chinas virtuelle Studentin Hua Zhibing an der Tsinghua University[6], die auf dem WuDao multimodalen Modell aufgebaut ist. „Die größte Bedeutung von WuDao besteht darin, dass es die Anwendungsschwellen von KI senkt und die Kosten für den Trainingsprozess von Modellen für maschinelles Lernen, einschließlich Arbeitskosten und CO2-Emissionen, reduziert“, sagte Professor Tang, stellvertretender Dekan für akademische Angelegenheiten der Beijing Academy of Artificial Intelligence[7].
Aus den Dialogen werden Taten
Die optimale Suche und die Zusammenstellung der gefundenen Informationen durch die Dialoge mit KI bilden eine Seite des Prozesses. Die andere Seite ist das Erledigen der Kundenwünsche.
Sie wollen z.B. ein Ticket „Berlin – Paris“ bestellen, einen Praxistermin vereinbaren oder durch einen Dialog mit der Konversations-KI einen Online-Spiel erstellen lassen (Codex bei OpenAI[8]). Kein Problem! Neue Sprachtechnologien aktivieren die Schnittstellen im Hintergrund, um die in Dialogen mit Chatbots erkannten Aufforderungen durchführen zu können. Dabei vermischt sich wieder virtuelle und reelle Welt, ergänzt sich gegenseitig und lernt dabei die Welt aufs Neue zu erkennen.
Aber was hat das alles mit Ihnen als KMU zu tun? Die gute Nachricht ist, dass auch Sie bei dieser Chatbot-Revolution dabei sein können. Sie können sofort mit der Entwicklung eines Unternehmen-Chatbots anfangen, z.B. auf der Dialogflow CX Plattform von Google[9]. Wir, als Mittestand 4.0 Kompetenzzentrum[10], helfen, beraten, begleiten Sie, und wünschen einen gemeinsamen, fruchtbaren DIALOG mit Ihnen!
4 https://www.sciencealert.com/these-researchers-have-redefined-life-to-search-for-new-fundamental-principles
5 https://blog.google/technology/ai/lamda/
6 https://www.globaltimes.cn/page/202106/1225392.shtml
7 http://german.china.org.cn/txt/2021-06/03/content_77546337.htm
8 https://openai.com/blog/openai-codex/
9 https://cloud.google.com/dialogflow/cx/docs
10 https://www.kompetenzzentrum-cottbus.digital/