Multimodale KI und ihre Anwendungen in der Wirtschaft | KI im Geschäft Nr. 21
Veröffentlicht: 2022-10-11Die heute für Unternehmen verfügbaren künstlichen Intelligenzmodelle unterscheiden sich von menschlicher Intelligenz vor allem dadurch, dass sie meist unimodal sind. Das bedeutet, dass sie nur eine Art von Informationen aufnehmen. Der nächste Schritt auf dem Weg zu einer vollständig leistungsfähigen KI betrifft multimodale Modelle. Sie integrieren verschiedene Arten von Daten, so wie Menschen mehrere Sinne entwickelt haben, um die Welt, in der sie leben, zu erkunden. Aber welche Anwendungen hat multimodale KI in der Wirtschaft?
Multimodale KI – Inhaltsverzeichnis:
- Einführung
- Multimodale KI heute
- Gato und die Zukunft der multimodalen KI in der Wirtschaft
- Zusammenfassung
Einführung
Die meisten der heutigen Modelle der künstlichen Intelligenz trainieren mit einer Art von Daten. Dazu können gehören:
- Texte – wie in Natural Language Processing (NLP)
- Bilder – wie im Fall von Bilderkennungstechnologien (Computer Vision), die die Identifizierung von Gesichtern, Formen, Fingerabdrücken usw.
- Numerische Daten – für die Analyse von Geschäftsdaten
Solche unimodalen Modelle verarbeiten schnell große Informationsmengen und erkennen Muster viel besser als Menschen. Sie haben jedoch schwerwiegende Einschränkungen. Sie sind kontextunempfindlich und nicht sehr geschickt im Umgang mit ungewöhnlichen und mehrdeutigen Situationen.
Diese schwierigsten Aufgaben für künstliche Intelligenz werden von multimodalen Modellen viel besser bewältigt. Sie können, wie Menschen, die Welt mit unterschiedlichen „Sinnen“ erkunden und aus unterschiedlichen Quellen lernen. Dabei verbinden sie sowohl entfernte Fakten als auch eine Vielzahl von Daten miteinander.
Im geschäftlichen Kontext könnte eine zukunftsorientierte multimodale KI beispielsweise die Optimierung der Geschäftsprozesse eines Unternehmens, die Analyse von Social-Media-Beiträgen, die Organisation der Logistik oder sogar die physische Positionierung von Waren in einem Lager übernehmen. Mit Zugriff auf verschiedene Arten von Daten könnte es das Unternehmen zentral verwalten und gleichzeitig über umfassende und detaillierte Kenntnisse aller messbaren Aspekte der Geschäftstätigkeit verfügen.
Multimodale KI heute
Ein Modell der künstlichen Intelligenz, das sich Multimodalität zunutze macht, ist DALL-E 2, der Autor überraschender Bilder, die aus Texthinweisen erstellt wurden. Die Fähigkeiten der heutigen „multisensorischen“ künstlichen Intelligenz gehen jedoch weit über das Komponieren von Visuals hinaus. Heute entwickelte Modelle kombinieren Modalitätspaare wie:
- Text und Bild
- Text und Ton
- Texte und Videos
- Bild und dreidimensionales Modell
Eines der aufregendsten Tools, das bereits Anerkennung gefunden hat, ist Synthesia. Diese browserbasierte Plattform zum Erstellen von Videos basierend auf dem eingegebenen Text bietet eine visuelle Präsentation, die von einem Avatar-Dozenten begleitet wird. Synthesia bietet umfassende Funktionen für die Hersteller von:
- Produktpräsentationen
- Handbücher für Software und technische Ausrüstung
- Übungsmaterial
Anstatt Schauspieler, Sprecher und Präsentationsdesigner einzustellen, nutzen Sie jetzt einfach die Dienste der multimodalen KI für Unternehmen und erstellen Sie in wenigen Minuten Filmmaterial auf der Grundlage gut geschriebener Texte. Durch die Verwendung des Übersetzungsmoduls bereiten Sie auch Materialien in mehreren Sprachversionen vor.
Gato und die Zukunft der multimodalen KI in der Wirtschaft
Das beste der modernen multimodalen Modelle ist Gato. Dieses von Deep Mind entwickelte tiefe neuronale Netzwerk erfasst gleichzeitig Informationen aus verschiedenen Quellen, es lernt schneller und effizienter als unimodale Modelle. Einige seiner Fähigkeiten umfassen:
- Bilder beschreiben – visuelle Daten in Textdaten umwandeln
- Manipulation von Objekten im physischen Raum – durch einen Roboterarm, der mit taktilen Sensoren und Kamerabildern ausgestattet ist, führt er Aufgaben im Zusammenhang mit der Neuanordnung von Objekten aus
- Ausführen eines textbasierten Chatbots – dh Ausführen von Chatbot- Aufgaben
- Verständnis von Regeln sowie Entscheidungsfindung in Spielen
Viele dieser Funktionalitäten sind heute bereits in komplexen Systemen wie autonomen Autos oder Smart Cities vorhanden. Ihre Anwendung wurde jedoch noch nicht im Bereich kleiner Unternehmen hochskaliert.
Dennoch kann man sich multimodale Funktionalitäten vorstellen, die verschiedenen Unternehmen bereitgestellt werden. Durch die Beschreibung von Bildern von CCTV-Kameras kann es Inventarwaren katalogisieren oder fehlende Produkte in Ladenregalen identifizieren. Die Objektmanipulation ermöglicht automatisch das Nachfüllen der zuvor identifizierten fehlenden Waren ohne menschliches Zutun.
Zusammenfassung
Multimodale künstliche Intelligenz hat große Hoffnungen geweckt. Aus unserer Sicht kündigt es in erster Linie revolutionäre Veränderungen in der Art und Weise an, wie KI für Unternehmen funktioniert. Statt verteilter Punktlösungen zur Automatisierung einfacher, sich wiederholender Aufgaben zeichnet sich am Horizont das Aufkommen leistungsstarker Tools ab, mit denen Daten aus einer Vielzahl von Quellen gesammelt und Schlussfolgerungen aus Datenmengen gezogen werden können, die über die menschliche Wahrnehmungsfähigkeit hinausgehen.
Vielleicht schafft KI in Zukunft sogar autonome Unternehmen. Früher wird es jedoch audiovisuelle Materialien in Echtzeit produzieren, die direkt auf die Produktanfragen der Kunden reagieren.
Wenn Ihnen unsere Inhalte gefallen, werden Sie Teil unserer fleißigen Bienen-Community auf Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
KI in der Wirtschaft:
- Künstliche Intelligenz in der Wirtschaft - Einführung
- Bedrohungen und Chancen von KI in der Wirtschaft (Teil 1)
- Gefahren und Chancen von KI in der Wirtschaft (Teil 2)
- KI-Anwendungen in der Wirtschaft – Überblick
- Was ist NLP oder Verarbeitung natürlicher Sprache in der Wirtschaft?
- Automatische Dokumentenverarbeitung
- KI und Social Media – was sagen sie über uns aus?
- Automatischer Übersetzer. Intelligente Lokalisierung digitaler Produkte
- KI-unterstützte Text-Chatbots
- Der Betrieb und die Geschäftsanwendungen von Voicebots
- Virtuelle Assistententechnologie oder wie man mit KI spricht?
- Business NLP heute und morgen
- Wie kann künstliche Intelligenz bei BPM helfen?
- Wird künstliche Intelligenz Business Analysten ersetzen?
- Die Rolle der KI bei der Entscheidungsfindung in Unternehmen
- Was ist Business Intelligence?
- Planen von Social-Media-Beiträgen. Wie kann KI helfen?
- Automatisierte Social-Media-Posts
- Künstliche Intelligenz im Content Management
- Kreative KI von heute und morgen
- Multimodale KI und ihre Anwendungen in der Wirtschaft
- Neue Interaktionen. Wie verändert KI die Art und Weise, wie wir Geräte bedienen?
- RPA und APIs in einem digitalen Unternehmen
- Neue Dienstleistungen und Produkte, die mit KI arbeiten
- Der Arbeitsmarkt der Zukunft und kommende Berufe
- Grüne KI und KI für die Erde
- EdTech. Künstliche Intelligenz in der Bildung