KI-Phone: Hype oder Beginn einer Revolution?

Portraitfoto von Prof. Dr. Matthias Böhmer (Bild: Monika Probst/TH Köln)

Essen bestellen, eine Unterkunft buchen oder einen Chat starten – dafür werden bislang verschiedene Apps auf dem Smartphone benötigt. Beim „KI-Phone“ soll das anders aussehen: Dieses soll ganz ohne Apps auskommen. Prof. Dr. Matthias Böhmer vom Cologne Institute for Digital Ecosystems ordnet das Potenzial der Technologie ein.

Prof. Böhmer, läutet das Konzept des KI-Phones ein neues Zeitalter der Smartphone-Nutzung ein?

Künstliche Intelligenz (KI) bringt eine echte Revolution in vielen Bereichen. Auch im täglichen Leben merken wir das schon. Bei dem KI-Phone handelt es sich um das Konzept eines Smartphones, das kürzlich auf einer Mobilfunkmesse vorgestellt wurde. Die Technologie im Hintergrund soll es den Nutzer*innen ermöglichen, über Spracheingabe mit einer KI zu kommunizieren, die Informationen aus dem Internet sammelt und sie direkt wiedergibt. Dazu sollen keine Websites oder Apps mehr aufgerufen werden müssen.

Smarte digitale Assistenten, zu denen ich grundsätzlich auch das KI-Phone zähle, sind keine neue Entwicklung. Auch die Sprachkommunikation mit einem KI-Assistenten über ein Mobiltelefon ist seit Jahren möglich – man denke nur an Siri, Alexa oder Google Assistant. Diese Form der Interaktion hat sich in einigen Bereichen bewährt, etwa wenn das Mobiltelefon nicht zur Hand ist oder nicht mit den Händen bedient werden soll. Beispiel: Ich möchte während der Autofahrt Musik über mein Handy hören oder eine Notiz abspeichern und gebe dazu einen Sprachbefehl an den digitalen Assistenten, um nicht zu sehr vom Verkehr abgelenkt zu werden. Das Konzept des KI-Phones sieht dagegen einen radikalen Ersatz von mobilen Anwendungen vor. Die Interaktion soll sich rein auf sprachbasierte Dialoge fokussieren. Ich bezweifle aber, dass sich dieses Konzept durchsetzen wird.

Was sind die Gründe für Ihre Skepsis?

Mobile Anwendungen sind die Kernfunktionalität heutiger Smartphones, mit denen die Geräte personalisiert werden können. Wenn man diese enorme Anzahl und Vielfalt an Apps und deren Funktionen durch einen einzigen Service ersetzen will, ist ein enormer Entwicklungs- und Programmieraufwand nötig. Hier ist ein weit verzweigtes Ökosystem entstanden und die KI auf dem Telefon müsste praktisch alle Schnittstellen anzapfen können, um an die benötigten Daten zu gelangen. Wir kennen zwar alle die praktische Interaktion mit Sprachmodellen wie ChatGPT, sind aber noch entfernt von menschenechter allgemeiner Künstlicher Intelligenz.

Bei einem Wandel von touchbasierter hin zu sprachbasierter Interaktion gibt es weitere Herausforderungen. Wesentliches Ziel von Social Apps und Media-Plattformen ist es beispielsweise, dass sich möglichst viele Nutzende möglichst lange dort aufhalten und mit den angezeigten Inhalten der Werbekund*innen interagieren, damit diese mehr Anzeigen schalten. In rein sprachbasierter Interkation ist schwer vorstellbar, dass solche Geschäftsmodelle funktionieren. Ebenso, dass die Nutzer*innen das permanente Vorlesen von Werbung akzeptieren werden.

Sehen Sie weitere Schwierigkeiten?

In Apps sind wir es gewohnt, die Informationsflut mit den Augen zu überfliegen oder mit den Fingern flink wegzuwischen. Hinzu kommt, dass wir sensible Informationen wie Zugangsdaten zum Online-Banking oder gewisse Suchabfragen wohl nicht per Sprache preisgeben würden ­– vor allem nicht im öffentlichen Raum. Unklar ist auch, ob die Informationssuche per Sprachbefehl mindestens so intuitiv, schnell und erfolgreich abläuft wie über die gewohnten mobilen Anwendungen. Legen wir zudem unsere Informationsversorgung in die Hand eines einzigen KI-Anbieters, kommt die Frage nach Neutralität auf: Ist das gebuchte Hotel wirklich für mich das beste oder hat der KI-Betreiber dabei auch einen Nutzen?

Was spricht für einen möglichen Erfolg des KI-Phones?

Auf der Mobilfunkmesse wurden zwei Varianten des KI-Phones vorgestellt: Zum einen die Version mit Datenverarbeitung in der Cloud, die auf einem bereits existierenden Gerät und mit dem Android-Betriebssystem laufen soll. Zum anderen ein leistungsfähigeres Smartphone, bei dem ein Großteil der Datenverarbeitung durch die KI über einen speziellen Prozessor auf dem Gerät selbst erfolgen soll. Letzteres bezeichnet man als Edge AI. Bei dieser Variante sind für den möglichen Erfolg zwei Aspekte interessant: Erstens ist die Privatsphäre höher, da die Daten direkt auf dem Telefon verarbeitet werden. Zweitens müssen die Interaktionen mit der KI nicht in die Cloud übertragen werden, wodurch weniger Datenverkehr in Netzwerken anfällt. Damit ist auch die Latenz geringer, also die Zeit, die ein Datenpaket benötigt, um von einem Punkt zu einem anderen zu gelangen – zum Beispiel von einem Smartphone zu einem Webserver und wieder zurück. Eine schnelle Reaktionszeit fördert die Akzeptanz der Nutzer*innen.

Wie setzen sich Lehre und Forschung an der TH Köln mit dem Thema Künstliche Intelligenz auseinander?

In unseren Studiengängen der Medieninformatik können sich die Studierenden mit den Themenfeldern „Menschzentrierte Künstliche Intelligenz“ und „Mensch-Computer-Interaktion“ beschäftigen. Es geht darum, dass unsere Studierenden Kompetenzen aufbauen, um die revolutionäre Kraft von KI in den verschiedenen Bereichen sinnvoll und verantwortungsbewusst einzusetzen. Wir beschäftigen uns mit den nötigen Algorithmen und der Programmierung, aber auch mit der User Experience und den ethischen Aspekten. In meinem Modul „Mobile Computing“ geht es um die Entwicklung von Apps, dazu zählt auch die technische Umsetzung von sprachbasierter Interaktion. Darüber hinaus wird an der Hochschule intensiv zu Künstlicher Intelligenz in der Mensch-Technik-Interaktion geforscht. Beispiele hierfür sind Chatbots oder die Verständigung mit sozialen Robotern sowie die Zusammenarbeit von Mensch und Maschine, unter anderem durch Sprachsteuerung.

März 2024

Daniel Schäfer

Team Presse und Öffentlichkeitsarbeit


M
M