Warum den Human-in-the-Loop-Ansatz (HITL) beim maschinellen Lernen verwenden?

Veröffentlicht: 2022-07-20

Haben Sie von dem selbstfahrenden Uber-Auto gehört, das eine Frau in Arizona angefahren und getötet hat? Bei einer anderen Gelegenheit profilierte eine Gesichtserkennungslösung einen unschuldigen Farbigen als Kriminellen in New Jersey, und das KI-gestützte Rekrutierungstool von Amazon zeigte Vorurteile gegenüber weiblichen Kandidaten.

Natürlich macht künstliche Intelligenz Fehler. Bedeutende, sogar lebensverändernde Fehler. Wie können wir also trotzdem die Vorteile der KI nutzen und gleichzeitig diese Art von Fehlern eliminieren? Eine Möglichkeit besteht darin, KI-Geschäftslösungen nach der Bereitstellung von menschlichen Experten schulen, evaluieren und überwachen zu lassen. Dieses Konzept wird als Human-in-the-Loop (HITL) maschinelles Lernen bezeichnet. Gartner prognostiziert, dass KI-Lösungen von HITL in einigen Branchen bis 2025 rund 30 % aller Automatisierungsangebote ausmachen werden.

Wir haben mit unserem KI-Experten Maksym Bochok gesprochen, um zu verstehen, wie Menschen in den Kreislauf passen, welche Vorteile sie bringen und wie dieser Prozess organisiert werden kann.

Human-in-the-Loop-Definition und -Vorteile

Irren ist menschlich, um Dinge wirklich zu vermasseln, braucht es einen Computer.

–Paul Ehlrich, ein deutscher Arzt und Nobelpreisträger

Jetzt ist Ehlrichs Zitat aktueller denn je. Da KI kritische Anwendungen handhabt, wird die Fehlerquote immer geringer. Und Maschinen sind nicht perfekt. Sie bauen ihr Verständnis der Aufgabe auf der Grundlage der erhaltenen Trainingsdaten auf und können falsche Annahmen treffen.

Und das bringt uns zur Human-in-the-Loop-Terminologie des maschinellen Lernens.

Human in the Loop bedeutet, menschliche Mitarbeiter in die Machine-Learning-Pipeline einzubinden, damit sie Modelle kontinuierlich trainieren und validieren können. Dazu gehören alle Personen, die mit Modellen und deren Trainingsdaten arbeiten.

Wie Human-in-the-Loop Ihren maschinellen Lernalgorithmen einen Mehrwert verleiht

Behält ein hohes Maß an Präzision bei. Dies ist besonders wichtig für Domains, die keine Fehler tolerieren können. Wenn wir beispielsweise kritische Ausrüstung für ein Flugzeug herstellen, wollen wir Automatisierung und Geschwindigkeit, aber wir dürfen die Sicherheit nicht gefährden. HITL ist auch in weniger kritischen Anwendungen von Vorteil. Beispielsweise nutzen große Beratungsunternehmen, die sich für die Einhaltung gesetzlicher Vorschriften stark auf KI verlassen, menschliches maschinelles Lernen, um ihre Verarbeitungsalgorithmen für natürliche Sprache zu validieren.

Eliminiert Vorurteile. Modelle für maschinelles Lernen können während des Trainings verzerrt werden. Darüber hinaus können sie nach dem Einsatz Vorurteile entwickeln, da sie weiter lernen. Menschliche Mitarbeiter können dieses Phänomen frühzeitig erkennen und beseitigen, indem sie den Algorithmus entsprechend korrigieren.

Sorgt für Transparenz. ML-Algorithmen werten Tausende oder sogar Millionen von Parametern aus, um eine endgültige Entscheidung zu treffen, die oft nicht erklärt werden kann. Mit HITL gibt es einen Menschen, der versteht, wie Algorithmen funktionieren, und der seine Entscheidungen rechtfertigen kann. Dies wird als erklärbare KI bezeichnet. Wenn eine Person beispielsweise einen Kredit beantragt und abgelehnt wird, kann sie einen Kreditsachbearbeiter bitten, die Gründe für die Ablehnung zu erläutern und zu erklären, was der Antragsteller tun kann, um seine Chancen beim nächsten Mal zu erhöhen.

Öffnet Beschäftigungsmöglichkeiten. Wir hören oft, dass KI Menschen die Jobs stiehlt. Maschinelles Lernen mit einem Menschen in der Schleife ist ein Beispiel dafür, wie die Technologie neue Stellenangebote schaffen kann. Schauen Sie sich nur den indischen Markt für Datenannotatoren an.

Die Rolle des Menschen in der KI-Pipeline

Maksym erklärt, wie Menschen Teil der KI-Pipeline sein können, um ihre Fähigkeit, Vorhersagen zu treffen, zu verbessern. Modelle für maschinelles Lernen arbeiten entweder im überwachten oder im nicht überwachten Lernmodus. Beim überwachten Lernen können Personen folgende Aufgaben ausführen:

  • Beschriftung und Anmerkung. Ein menschlicher Mitarbeiter beschriftet den Trainingsdatensatz. Je nach erforderlichem Fachwissen kann dies ein Domänenexperte oder jeder Mitarbeiter mit entsprechender Ausbildung sein.
  • Überarbeitung des Modells. Bei Bedarf können ML-Ingenieure und Programmierer Anpassungen am Algorithmus vornehmen, um sicherzustellen, dass er das Beste aus dem bereitgestellten Datensatz herausholen kann.
  • Aus- und Umschulung. Mitarbeiter füttern das Modell mit den annotierten Daten, sehen sich die Ausgabe an, nehmen Korrekturen vor, fügen nach Möglichkeit weitere Daten hinzu und trainieren das Modell neu.
  • Überwachen der Leistung des Modells nach der Bereitstellung. Der Human-in-the-Loop-Lebenszyklus des maschinellen Lernens endet nicht nach der Bereitstellung der KI-Lösung beim Kunden. ML-Ingenieure überwachen weiterhin seine Leistung mit Zustimmung des Kunden und nehmen bei Bedarf Anpassungen am Modell durch selektive Überprüfung seiner Ergebnisse vor. Die durch selektive Überprüfung erhaltenen Fälle werden den anfänglichen Trainingsdatensatz erweitern, um die Leistung des Algorithmus zu verbessern.

Beim unüberwachten maschinellen Lernen nehmen Algorithmen unbeschriftete Daten als Input und finden selbst eine Struktur. In diesem Fall kommentieren Menschen den Datensatz nicht und greifen nicht viel in das anfängliche Training ein. Sie können das Modell jedoch erheblich bereichern, indem sie den obigen Schritt 4 ausführen.

Beim Human-in-the-Loop ist maschinelles Lernen eine absolute Notwendigkeit

Maksym glaubt, dass der Human-in-the-Loop-Ansatz für die meisten Anwendungsfälle des maschinellen Lernens von Vorteil ist. KI-Lösungen sind beeindruckend darin, optimale Vorhersagen zu treffen, wenn sie auf großen, umfangreichen Datensätzen trainiert werden, während Menschen Muster aus einem begrenzten Vorrat an Datenproben von geringer Qualität erkennen können. Durch die Kombination beider Fähigkeiten kann ein leistungsstarkes System entstehen. Auch wenn ML-Modelle in einigen Anwendungen mit begrenztem menschlichem Eingreifen gut auskommen, gibt es Fälle, in denen ein vollwertiges Human-in-the-Loop-System ein Muss ist:

  • Jeder Fehler des Algorithmus kann sehr kostspielig sein, wie z. B. bei der medizinischen Diagnose.
  • Wenn die Daten, die Sie benötigen, um den Algorithmus richtig zu trainieren, knapp sind. Mehr Trainingsdaten bedeuten immer eine bessere Modellleistung. Mit Hilfe der Modellüberwachung nach der Produktion können Sie die Trainingsdaten mit relevanten Beispielen anreichern und dem Modell mehr Beispiele zum Lernen geben.
  • Beim One-Shot-Learning wird ein Algorithmus mit Hunderten oder sogar Tausenden von Proben trainiert, um einige Objekte zu klassifizieren. Und dann wird eine weitere Klasse hinzugefügt, und der Algorithmus muss lernen, sie aus nur wenigen Trainingsbeispielen zu identifizieren.
  • In stark regulierten Branchen, in denen es wichtig ist zu erklären, wie die Algorithmen zu ihren Schlussfolgerungen gelangt sind. Wenn Ärzte beispielsweise KI verwenden, um personalisierte Krebsbehandlungen vorzuschlagen, müssen sie diesen Behandlungsplan gegenüber dem Patienten rechtfertigen.

Wenn man sich die Art der Daten ansieht, die ML-Algorithmen verarbeiten, wäre HITL-KI für Computer-Vision-Anwendungen und die Verarbeitung natürlicher Sprache (NLP) unerlässlich, insbesondere wenn es um die Stimmungsanalyse eines Textes geht, der Sarkasmus enthalten könnte. HITL ist weniger wichtig für Tabellendaten und Zeitreihenanalysen.

Tipps zur Verbesserung der künstlichen Intelligenz mit Human-in-the-Loop-Praktiken

Maksym bietet die folgenden Tipps zur erfolgreichen Implementierung des Human-in-the-Loop-Ansatzes im maschinellen Lernen:

  • Beim Überwachen und Analysieren der Leistung eines Algorithmus nach der Bereitstellung können menschliche Teilnehmer, egal wie gut das Human-in-the-Loop-System ist, nicht auf jede Eingabe achten, die der Algorithmus verarbeitet, und auf jede Ausgabe, die er generiert. Wählen Sie Ihre Fälle mit Bedacht aus. Verwenden Sie die selektive Überprüfung, um die Fälle auszuwählen, die Ihre Aufmerksamkeit verdienen. Maksym schlägt diese Ansätze zur intelligenten Fallauswahl vor:
  • Basierend auf Konfidenzniveaus. Beispielsweise muss ein Algorithmus jedes Eingabebild entweder als Katze oder als Hund klassifizieren. Die Bilder, die ein Konfidenzniveau von etwa 48/52 oder etwas Ähnliches erhalten, sind diejenigen, die die Algorithmen verwirren und ordnungsgemäß gekennzeichnet und zum erneuten Trainieren des Modells verwendet werden müssen.
  • Zufällige Überprüfung von „trivialen“ Fällen. Nehmen wir an, dass nur einer von zehn Fällen wertvolle Informationen über die Leistung eines Algorithmus enthält. Ein Beispiel für einen solchen Fall ist, wenn das Modell sich einer falschen Vorhersage zu sicher ist. Sie sollten diesen Fall auf jeden Fall in Betracht ziehen, aber Sie müssen auch zufällig einen der verbleibenden neun Fälle auswählen, um sicherzustellen, dass der Algorithmus nicht mit seinen falschen Vorhersagen übermütig wird oder Verzerrungen zulässt.
  • Beschränken Sie sich bei der Analyse der Fälle, die Sie im vorherigen Schritt ausgewählt haben, nicht auf das Endergebnis. Anstatt die Ausgabe des letzten Satzes von Neuronen in neuronalen Netzwerken zu betrachten, überprüfen Sie die vorherige Schicht, wie im Bild unten, und analysieren Sie die Verteilung der Abstände zwischen einer falschen Vorhersage und den nächsten richtigen Vorhersagen, die der Algorithmus macht.
  • Ermutigen Sie die Endbenutzer des Algorithmus, Feedback zu seiner Leistung zu geben. Erstellen Sie Feedback-Formulare und stellen Sie sie allen zur Verfügung, damit die Benutzer etwaige Bedenken äußern können.
  • Erweitern Sie den Trainingsdatensatz iterativ mit Datenpunkten aus den vorherigen Schritten. Auf diese Weise stellen Sie sicher, dass Ihr Algorithmus auch bei Änderungen im Betrieb des Kunden relevant bleibt.

Standardmäßige HITL-fähige KI-Tools

Es gibt einige vorgefertigte Human-in-the-Loop-Tools für maschinelles Lernen, mit denen Sie Trainingsdatensätze kennzeichnen und das Ergebnis überprüfen können. Mit diesen standardisierten Tools können Sie die obigen Tipps jedoch möglicherweise nicht umsetzen. Hier sind einige Beispiele für Human-in-the-Loop-Tools:

Google Cloud-HITL

Diese Lösung bietet einen Workflow und eine Benutzeroberfläche (UI), die Benutzer verwenden können, um die aus Dokumenten extrahierten Daten zu kennzeichnen, zu überprüfen und zu bearbeiten. Das Kundenunternehmen kann entweder seine eigenen Mitarbeiter als Etikettierer einsetzen oder Google HITL-Mitarbeiter einstellen, um die Aufgabe zu erfüllen.

Das Tool verfügt über bestimmte UI-Funktionen, um den Arbeitsablauf von Etikettierern zu optimieren und die Ausgabe basierend auf dem Konfidenzschwellenwert zu filtern. Es ermöglicht Unternehmen auch, den Pool ihrer Etikettierer zu verwalten.

Erweiterte KI von Amazon (Amazon A2I)

Dieses Human-in-the-Loop-Tool für künstliche Intelligenz ermöglicht es Menschen, wenig zuverlässige und zufällige ML-Vorhersagen zu überprüfen. Im Gegensatz zu Google Cloud HITL, das nur mit Text arbeitet, kann Amazon A2I Amazon Recognition ergänzen, um Bilder zu extrahieren und Ergebnisse zu validieren. Es kann auch helfen, tabellarische Daten zu überprüfen.

Wenn ein Kunde mit dem bereitgestellten A2I-Workflow nicht zufrieden ist, kann er mit SageMaker oder einem ähnlichen Tool einen eigenen Ansatz entwickeln.

DataRobot bescheidene KI

Humble AI ermöglicht es Menschen, eine Reihe von Regeln festzulegen, die ML-Modelle anwenden müssen, während sie Vorhersagen treffen. Jede Regel enthält eine Bedingung und eine entsprechende Aktion. Derzeit gibt es drei Aktionen:

  • Kein Betrieb, wenn der Mensch nur den entsprechenden Zustand überwacht, ohne einzugreifen
  • Überschreiben der Vorhersage, wenn Benutzer die Ausgabe des Modells durch einen anderen Wert ersetzen können
  • Fehler zurückgeben, einfach die Vorhersage insgesamt verwerfen

Ist maschinelles Lernen mit einem Human-in-the-Loop also der beste Ansatz für Sie?

Der Einsatz des Human-in-the-Loop-KI-Ansatzes verbessert die Genauigkeit, Transparenz und Qualität von Vorhersagen. Es erhöht auch die Kosten und die Zeit, die erforderlich sind, um die Aufgabe aufgrund menschlicher Eingriffe abzuschließen, und schafft gleichzeitig Beschäftigungsmöglichkeiten, was ein positiver Nebeneffekt ist.

Trotz der offensichtlichen Vorteile von HITL-KI gibt es Anwendungen, bei denen Human-out-of-the-Loop aufgrund der mit bestimmten Aktivitäten verbundenen Risiken ein bevorzugter Ansatz ist. Denken Sie an autonome Waffenentwicklung und -einsatz.

Wenn Sie der Meinung sind, dass Ihre ML-Algorithmen einen Menschen in der Schleife verwenden können, aber nicht sicher sind, wie Sie die Betriebskosten und die gewünschte Genauigkeit und Erklärbarkeit in Einklang bringen sollen, wenden Sie sich an Berater für maschinelles Lernen. Sie werden mit Ihnen zusammenarbeiten, um die richtige Passform zu finden. Wenn Human-in-the-Loop-Machine-Learning in Ihrem Fall nicht die optimale Lösung ist, gibt es andere ML-Tricks, die Ihnen helfen können, das Problem der Trainingsdatenknappheit zu überwinden:

  • Transfer Learning , wenn Sie vortrainierte Modelle mit Ihren eigenen Daten optimieren
  • Halbüberwachtes Lernen , wenn Sie einen großen unbeschrifteten Datensatz zusammen mit einer kleinen Anzahl beschrifteter Proben verwenden
  • Selbstüberwachtes Lernen , wenn Sie einen zufälligen Teil der Trainingsstichprobe in jedem Stapel maskieren und der Algorithmus versucht, ihn vorherzusagen

Erwägen Sie, die Genauigkeit und Erklärbarkeit Ihres ML-Modells zu verbessern? In Kontakt kommen! Die KI-Experten von ITrex werden Ihre Situation untersuchen und einen optimalen Human-in-the-Loop-Ansatz entwickeln, um Ihre Anforderungen zu erfüllen.


Ursprünglich am 17. Juli 2022 unter https://itrexgroup.com veröffentlicht.