Vergrößern Sie den Prozess des Aufbaus einer Empfehlungsmaschine
Veröffentlicht: 2023-08-03Mehr als 80 % der Sendungen, die sich die Leute auf Netflix ansehen, werden über die Empfehlungsmaschine der Plattform entdeckt. Das bedeutet, dass der Großteil dessen, worauf Ihr Blick fällt, das Ergebnis von Entscheidungen ist, die von einer hochentwickelten Maschine getroffen werden.
Der Streaming-Dienst setzt auf künstliche Intelligenz, um nuancierte Handlungsstränge innerhalb des Inhalts zu untersuchen und tief in die Vorlieben der Zuschauer einzutauchen. Und man kann mit Sicherheit sagen: Der Aufwand lohnt sich!
Wenn Sie noch im Rückstand sind, aber das Erlebnis Ihrer Kunden mit Ihrem Unternehmen verbessern möchten, lesen Sie weiter. In diesem Blogbeitrag führen wir Sie durch den Prozess des Aufbaus einer Empfehlungsmaschine und beleuchten alles, was Sie wissen müssen, bevor Sie sich an KI-Dienstleister wenden.
Empfehlungs-Engines 101: Was Sie wissen sollten, bevor Sie sich an die Entwicklung wagen
Bevor wir uns mit dem Aufbau einer Empfehlungs-Engine befassen, werfen wir einen Blick auf die Typen, Anwendungsfälle und Implementierungsoptionen einer Empfehlungs-Engine.
Traditionell werden Empfehlungssysteme in zwei große Kategorien unterteilt: inhaltsbasierte Filtersysteme und kollaborative Filtersysteme.
Inhaltsbasierte Filterung
Inhaltsbasierte Filtersysteme generieren Empfehlungen basierend auf den Eigenschaften oder Merkmalen von Inhalten. Mit anderen Worten: Sie empfehlen Produkte oder Inhalte, die denen ähneln, die einem Benutzer zuvor gefallen oder mit denen er interagiert hat. Auf diese Weise kann eine Empfehlungsmaschine einem Leser, dem „Im Westen nichts Neues“ und „Catch-22“ gefallen hat, „A Farewell to Arms“ vorschlagen.
Aber woher weiß die Engine, welche Artikel ähnlich sind? Schauen wir uns den Ansatz von Netflix zum Aufbau einer Empfehlungsmaschine an, um das zu verstehen. Obwohl das Empfehlungssystem von Netflix hybrider Natur ist, basiert es in hohem Maße auf inhaltlicher Ähnlichkeit.
Der Streaming-Dienst verfügt über ein Team von Taggern, die jeden neuen Inhalt beobachten und ihn kennzeichnen. Die Schlagworte reichen von der Action des Stücks bis hin zu der Frage, ob es im Weltraum spielt oder einen bestimmten Schauspieler in der Hauptrolle spielt. Durch die Analyse der Tag-Daten anhand des Zuschauerverhaltens mit maschinellen Lernalgorithmen kann die Streaming-Plattform herausfinden, was für jeden Benutzer wirklich relevant ist.
Kollaboratives Filtern
Kollaborative Filtersysteme geben Empfehlungen basierend auf Benutzerfeedback. Solche Systeme gehen davon aus, dass Benutzer, denen ähnliche Artikel gefallen haben, wahrscheinlich ähnlich auf neue Produkte und Inhalte reagieren.
Es gibt zwei Ansätze zum Aufbau einer Empfehlungsmaschine, die auf kollaborativer Filterung basiert: benutzerbasiert und artikelbasiert.
Mit benutzerbasierter Filterung erstellen Sie Segmente ähnlicher Benutzer mit gemeinsamen Präferenzen. Daher ist es wahrscheinlich, dass einem Benutzer ein Artikel empfohlen wird, der anderen Benutzern aus dem Segment gefallen hat. Inhaltliche Besonderheiten werden nicht berücksichtigt.
Bei der artikelbasierten Filterung erstellt die Engine Empfehlungen basierend auf der Ähnlichkeit der Artikel, die einem Benutzer gefallen haben, mit den vorgeschlagenen Artikeln. Klingt ähnlich wie inhaltsbasierte Filterung, nicht wahr? Obwohl sowohl inhaltsbasierte als auch artikelbasierte kollaborative Filtersysteme die Artikelähnlichkeit nutzen, um Empfehlungen abzugeben, unterscheiden sie sich darin, wie sie feststellen, was ähnlich ist.
Inhaltsbasierte Filtersysteme empfehlen lediglich Artikel, die denen ähneln, die einem Benutzer bereits gefallen haben. Mit der artikelbasierten kollaborativen Filterung wird Ihnen ein Artikel empfohlen, der dem ähnelt, was Ihnen gefallen hat und der auch den Nutzern in Ihrem Segment gefällt.
Die Anwendungsfälle von Empfehlungsmaschinen
Ein hohes Maß an Personalisierung ist zu einer Notwendigkeit geworden, die Benutzer erwarten, und veranlasst Unternehmen, ihre Online-Erlebnisse mit Empfehlungsmaschinen zu bereichern. Die Bereiche, in denen Empfehlungsmaschinen weit verbreitet sind, umfassen:
- Einzelhandel und E-Commerce: Empfehlungsmaschinen im E-Commerce können alles tun, von der Kategorisierung von Produkten bis hin zum Vorschlagen neuer Artikel für Kunden zum Kauf. Die Auswirkungen, die durch die Implementierung einer Empfehlungsmaschine im E-Commerce und den damit verbundenen verbesserten Kundenservice, verbessertes Marketing und umfassendere Upselling-Möglichkeiten erzielt werden, sind kaum zu überschätzen. Der bekannte E-Commerce-Tycoon Amazon erwirtschaftet beispielsweise 35 % seines Umsatzes mit Hilfe seines Empfehlungssystems.
- Medien und Unterhaltung: Von der Zusammenstellung von Playlists bis hin zum Anbieten personalisierter Vorschläge auf der Grundlage früherer Interaktionen helfen Empfehlungs-Engines Medien- und Unterhaltungsplattformen dabei, Benutzer länger einzubinden, indem sie ihnen Inhalte zeigen, die sie sonst nicht entdecken würden. Die größten Medien- und Unterhaltungsplattformen wie YouTube, Netflix und Spotify verlassen sich stark auf KI-generierte personalisierte Empfehlungen, um neue Nutzer zu gewinnen und zu binden.
- Social Media: Auch die Social-Media-Branche nutzt die Möglichkeiten, personalisierte Vorschläge zu machen. Indem sie Nutzern helfen, ähnliche Seiten und Konten zu entdecken, regen Social-Media-Plattformen ihre Nutzer dazu an, mehr Zeit mit der Interaktion mit den Inhalten zu verbringen, was die Klickraten steigert und den Umsatz steigert.
- Bank- und Finanzwesen: KI-basierte Empfehlungssysteme ermöglichen es Banken, die Transaktionen der Benutzer zu analysieren und durch Upselling den Umsatz zu steigern. Wenn ein Benutzer beispielsweise ein Flugticket im Wert von 500 US-Dollar kauft, geht die Empfehlungsmaschine automatisch davon aus, dass er ins Ausland fliegt, und schlägt ihm den Kauf eines Reiseversicherungspakets vor.
Implementierungsmöglichkeiten zur Auswahl
Wenn Sie sich auf den Weg zum Aufbau einer Empfehlungsmaschine machen, werden Sie auf mehrere Implementierungsoptionen mit jeweils eigenen Vorteilen und Überlegungen stoßen, nämlich:
Plug-and-Play-Empfehlungs-Engines
Plug-and-Play-Empfehlungs-Engines bieten eine bequeme und problemlose Möglichkeit, personalisierte Empfehlungen in Ihr Produkt oder Ihre Plattform zu integrieren. Sie sind vorgefertigt und so konzipiert, dass sie sich nahtlos in Ihre bestehende Infrastruktur integrieren lassen.
Der Hauptvorteil von Plug-and-Play-Empfehlungs-Engines liegt in ihrer Einfachheit und Benutzerfreundlichkeit. Sie sind in der Regel benutzerfreundlich gestaltet, sodass auch technisch nicht versierte Zielgruppen sie mit minimalem Aufwand einrichten können. Beispiele für Plug-and-Play-Empfehlungs-Engines umfassen Plattformen wie Recombee, Seldon und LiftIgniter.
Der Nachteil von Plug-and-Play-Empfehlungs-Engines ist die eingeschränkte Anpassungs- und Anpassungsfähigkeit. Sie bieten zwar Komfort und Geschwindigkeit, bieten jedoch möglicherweise nicht das Maß an Flexibilität und Feinabstimmung, das maßgeschneiderte Lösungen bieten.
Vorab trainierte cloudbasierte Empfehlungsdienste
Cloudbasierte Empfehlungs-Engines ermöglichen die Nutzung der enormen Rechenressourcen und des Fachwissens von Cloud-Dienstanbietern. Diese Empfehlungsdienste stellen in der Regel benutzerfreundliche APIs bereit, die es Entwicklern ermöglichen, Empfehlungsfunktionen problemlos in ihre Anwendungen zu integrieren.
Cloudbasierte Empfehlungs-Engines sind außerdem hoch skalierbar, sodass sie große Benutzergruppen und hohe Datenverkehrslasten bewältigen können. Ein weiterer Vorteil ist die kontinuierliche Verbesserung, da die zugrunde liegenden Modelle von den Dienstleistern aktualisiert und verfeinert werden.
Führende Anbieter von Cloud-Diensten wie Amazon Web Services, Google Cloud Platform und Microsoft Azure bieten vorab trainierte Empfehlungsdienste an.
Zu den Faktoren, die bei der Entscheidung für vorab trainierte cloudbasierte Empfehlungsdienste berücksichtigt werden müssen, gehören Datenschutz, Anbieterbindung und Anpassungsanforderungen. Obwohl diese Dienste Komfort und Skalierbarkeit bieten, weisen sie möglicherweise Einschränkungen hinsichtlich der Anpassung der Empfehlungsalgorithmen an Ihre spezifischen Geschäftsanforderungen auf.
Benutzerdefinierte Empfehlungs-Engines
Benutzerdefinierte Empfehlungs-Engines bieten ein Höchstmaß an Flexibilität und Kontrolle und ermöglichen Ihnen die Integration proprietärer Algorithmen, die Nutzung domänenspezifischen Wissens und die Berücksichtigung der Nuancen Ihrer Daten. Wenn Sie den benutzerdefinierten Weg wählen, können Sie die Feinheiten von Benutzerpräferenzen, Artikelmerkmalen und Kontextfaktoren erfassen, was in der Regel zu genaueren und relevanteren Empfehlungen führt.
Benutzerdefinierte Empfehlungs-Engines bieten zwar die größte Flexibilität, erfordern jedoch auch erhebliche Entwicklungsressourcen, Fachwissen im maschinellen Lernen und fortlaufenden Wartungsaufwand. Bevor Sie also eine benutzerdefinierte Empfehlungs-Engine erstellen, prüfen Sie sorgfältig Ihre Geschäftsanforderungen, verfügbaren Ressourcen und langfristigen Ziele.
Als Faustregel gilt, in den folgenden Szenarien den benutzerdefinierten Weg zu wählen:
- Sie haben einzigartige Geschäftsanforderungen: Wenn Ihr Unternehmen einzigartige Anforderungen hat, die nicht mit Standardlösungen erfüllt werden können, gehen Sie individuell vor. Dadurch können Sie den Algorithmus an Ihre spezifische Aufgabe anpassen. Angenommen, Sie sind eine Nischen-E-Commerce-Plattform, die handgefertigte Produkte verkauft. Möglicherweise haben Sie unterschiedliche Anforderungen, wenn es darum geht, Produkte vorzuschlagen: Die Empfehlungsmaschine muss Faktoren wie Produktseltenheit, Handwerkskunst und Benutzerpräferenzen für bestimmte Stile oder Materialien berücksichtigen. Durch den Aufbau einer Empfehlungs-Engine von Grund auf können Sie mit größerer Wahrscheinlichkeit Empfehlungen generieren, die den Präferenzen der Benutzer entsprechen.
- Sie möchten die volle Kontrolle und Verantwortung: Durch den Aufbau einer benutzerdefinierten Empfehlungs-Engine haben Sie die vollständige Kontrolle über den gesamten Empfehlungsgenerierungsprozess: von der Datenvorverarbeitung über die Algorithmusauswahl bis hin zur Feinabstimmung. Es ermöglicht Ihnen, die volle Kontrolle über das System zu erlangen und es an die Weiterentwicklung Ihres Unternehmens anzupassen, ohne auf Lösungen von Drittanbietern angewiesen zu sein.
- Sie verfügen über domänenspezifisches Wissen: Wenn Sie über domänenspezifisches Fachwissen verfügen oder Zugriff auf spezielle Daten haben, die die Empfehlungsgenauigkeit erheblich verbessern können, können Sie dieses Wissen durch den Aufbau einer benutzerdefinierten Lösung effektiv nutzen. Durch die Entwicklung einer maßgeschneiderten Empfehlungs-Engine können Sie domänenspezifische Funktionen oder Einschränkungen integrieren, die in vorab trainierten Lösungen möglicherweise nicht verfügbar sind.
- Ihre Anwendung erfordert eine hohe Skalierbarkeit und Leistung: Wenn Sie mit einer großen Anzahl von Benutzern oder Elementen rechnen, strenge Latenzbeschränkungen haben oder große und komplexe Datensätze verarbeiten müssen, bietet Ihnen der Aufbau einer benutzerdefinierten Empfehlungs-Engine die Flexibilität, das System maximal zu entwerfen und zu optimieren Skalierbarkeit und Leistung. Gleiches gilt, wenn Sie Empfehlungen in Echtzeit oder nahezu in Echtzeit generieren möchten.
- Sie möchten sich einen Wettbewerbsvorteil verschaffen: Wenn genaue Empfehlungen ein zentraler Differenzierungsfaktor für Ihr Produkt oder Ihre Dienstleistung sind, kann Ihnen der Aufbau einer benutzerdefinierten Empfehlungs-Engine einen Wettbewerbsvorteil verschaffen. In diesem Fall könnte die Investition in eine maßgeschneiderte Lösung die Möglichkeit bieten, einzigartige und personalisierte Erlebnisse zu bieten und so das Engagement, die Loyalität und die Kundenzufriedenheit zu steigern.
Erstellen Sie Schritt für Schritt eine benutzerdefinierte Empfehlungs-Engine
Die Bereitstellung personalisierter Empfehlungen ist eine Aufgabe, die typischerweise durch maschinelles Lernen gelöst wird. Auch neuronale Netze können eingesetzt werden, allerdings beschränkt sich ihre Rolle meist auf die Vorverarbeitung von Trainingsdaten. Hier sind die wichtigsten Schritte beim Aufbau einer Empfehlungs-Engine, die von den ITRex-Entwicklern für maschinelles Lernen geteilt werden.
Schritt 1. Richtung festlegen
Starten Sie die Entwicklung, indem Sie die Richtung für den Rest des Projekts festlegen. Zu den wesentlichen Dingen, die in dieser Phase zu tun sind, gehören:
Ziele setzen und Projektumfang definieren
Machen Sie deutlich, was Sie mit einem Empfehlungssystem erreichen wollen, und wägen Sie das gesetzte Ziel gegen Ressourcen- und Budgetbeschränkungen ab. Wenn Sie beispielsweise die Kundenbindung verbessern und den Umsatz in Ihrem Online-Shop steigern möchten, können Sie den Projektumfang auf die Empfehlung von Produkten an Kunden beschränken, die bereits einen Kauf getätigt haben. Den Umfang recht eng zu halten, erfordert weniger Aufwand als der Aufbau einer Empfehlungsmaschine, die alle Kunden anspricht, während das Potenzial zur Generierung eines ROI recht hoch bleibt.
Bewertung der verfügbaren Datenquellen
Die Leistung eines Empfehlungssystems hängt stark von der Menge und Qualität der Trainingsdaten ab. Bevor Sie mit dem Training beginnen, prüfen Sie sorgfältig, ob Sie über genügend Datenpunkte verfügen, um daraus Empfehlungen zu generieren.
Definieren von Leistungsmetriken
Eine der größten Herausforderungen beim Aufbau einer Empfehlungsmaschine, die gleich zu Beginn berücksichtigt werden sollte, ist die Definition von Erfolgsmetriken. Überlegen Sie, ob die neu generierten Empfehlungen den Benutzern tatsächlich gefallen, bevor Sie mit dem Training der ML-Algorithmen beginnen.
Schritt 2. Sammeln Sie Trainingsdaten
Der nächste Schritt beim Aufbau eines benutzerdefinierten Empfehlungssystems ist das Sammeln und Aufbereiten von Daten für das Training von Algorithmen für maschinelles Lernen. Um ein zuverlässiges Empfehlungssystem aufzubauen, benötigen Sie genügend Daten über Benutzerpräferenzen.
Abhängig vom Ansatz zum Aufbau einer Empfehlungsmaschine verschiebt sich Ihr Fokus. Bei der Erstellung eines kollaborativen Filtersystems konzentrieren sich die von Ihnen gesammelten Daten auf das Benutzerverhalten. Mit inhaltsbasierten Filtersystemen konzentrieren Sie sich auf die Merkmale von Inhalten, die den Benutzern gefallen.
Kollaboratives Filtern
Die Daten zum Nutzerverhalten können in unterschiedlicher Form vorliegen:
- Explizites Benutzerfeedback ist alles, was von einem Benutzer Anstrengungen erfordert, z. B. das Verfassen einer Rezension, das Gefällt mir für einen Inhalt oder ein Produkt, eine Beschwerde oder die Einleitung einer Rücksendung.
- Implizites Benutzer-Feedback, z. B. die bisherige Kaufhistorie, die Zeit, die ein Benutzer damit verbringt, sich ein bestimmtes Angebot anzusehen, Seh-/Hörgewohnheiten, in sozialen Medien hinterlassenes Feedback und mehr.
Beim Aufbau einer Empfehlungsmaschine empfehlen wir, sowohl explizites als auch implizites Feedback zu kombinieren, da letzteres es ermöglicht, in Benutzerpräferenzen einzudringen, die diese möglicherweise nur ungern zugeben, wodurch das System genauer wird.
Inhaltsbasierte Filterung
Beim Sammeln von Daten für inhaltsbasierte Filtersysteme ist es wichtig zu verstehen, auf welche Produkt-/Inhaltsfunktionen Sie sich verlassen sollten, wenn Sie herausfinden möchten, was den Benutzern gefällt.
Angenommen, Sie bauen eine Empfehlungsmaschine für Musikliebhaber. Sie können sich auf die Spektrogrammanalyse verlassen, um zu verstehen, welche Art von Musik ein bestimmter Benutzer mag, und um Titel mit ähnlichen Spektrogrammen zu empfehlen.
Alternativ können Sie Liedtexte als Grundlage für Ihre Empfehlungen wählen und Lieder empfehlen, die ähnliche Themen behandeln.
Der Schlüssel liegt im Testen und Optimieren, um zu verstehen, was für Sie am besten funktioniert, und um bereit zu sein, das ursprüngliche Modell kontinuierlich zu verbessern.
Schritt 3. Bereinigen und verarbeiten Sie die Daten
Um eine leistungsstarke Empfehlungsmaschine aufzubauen, müssen Sie den sich ändernden Benutzergeschmack berücksichtigen. Je nachdem, was Sie empfehlen, sind ältere Rezensionen oder Bewertungen möglicherweise nicht mehr relevant.
Um Ungenauigkeiten zu vermeiden, sollten Sie erwägen, nur Funktionen zu betrachten, die eher den aktuellen Benutzergeschmack widerspiegeln, Daten zu entfernen, die nicht mehr relevant sind, und den jüngsten Benutzeraktionen mehr Gewicht zu verleihen als den älteren.
Schritt 4. Wählen Sie einen optimalen Algorithmus
Der nächste Schritt beim Aufbau einer Empfehlungsmaschine ist die Auswahl eines für Ihre Aufgabe geeigneten Algorithmus für maschinelles Lernen. Die Datenwissenschaftler von ITRex empfehlen, Folgendes in Betracht zu ziehen:
- Die Matrixfaktorisierung zerlegt einen großen Datensatz in kleinere Teile, um verborgene Muster und Ähnlichkeiten zwischen Benutzern und Elementen aufzudecken.
- Die Tensorfaktorisierung ist eine Erweiterung der Matrixfaktorisierung, die höherdimensionale Datenstrukturen, sogenannte Tensoren, verarbeiten kann. Durch die Zerlegung von Tensoren in latente Faktoren erfasst es komplexere Muster und ermöglicht so ein detaillierteres Verständnis der Benutzer-Element-Interaktionen.
- Faktorisierungsmaschinen sind leistungsstarke Modelle, die hochdimensionale und spärliche Daten verarbeiten können. Sie erfassen Interaktionen zwischen Funktionen und können auf Empfehlungsaufgaben angewendet werden. Durch die Berücksichtigung von Funktionsinteraktionen können sie auch bei unvollständigen Daten genaue Empfehlungen geben.
- Nachbarschaftsmodelle finden Ähnlichkeiten zwischen Benutzern oder Elementen basierend auf Attributen oder Verhalten. Sie sind besonders effektiv für die kollaborative Filterung, da sie Verbindungen zwischen Benutzern oder Elementen in einem Netzwerk aufbauen und Empfehlungen basierend auf den Präferenzen ähnlicher Benutzer oder Elemente abgeben.
- Random Walk ist ein graphbasierter Algorithmus, der Verbindungen zwischen Elementen oder Benutzern in einem Netzwerk untersucht. Durch die Navigation im Netzwerk werden Ähnlichkeiten zwischen Elementen oder Benutzern erfasst und Empfehlungen basierend auf den erfassten Verbindungen abgegeben.
- SLIM ist eine Technik, die in Empfehlungssystemen verwendet wird, um zu verstehen, wie Elemente miteinander in Beziehung stehen. Es konzentriert sich auf die Suche nach Mustern in den Beziehungen zwischen Elementen und nutzt diese Muster, um Empfehlungen abzugeben.
- Lineare Modelle sagen Benutzerpräferenzen basierend auf linearen Beziehungen zwischen Features voraus. Obwohl sie leicht zu verstehen und schnell zu trainieren sind, erfassen sie komplexe Muster möglicherweise nicht so effektiv wie andere Ansätze.
Außerdem können Sie aus den folgenden Deep-Learning-Modellen wählen:
- DSSMs (Deep Structured Semantic Models) erlernen Darstellungen von Texten oder Dokumenten. Sie konzentrieren sich darauf, die semantische Bedeutung von Wörtern und ihre Beziehungen in einem strukturierten Rahmen zu erfassen.
- Graph Convolutional Networks sind für graphstrukturierte Daten konzipiert. Sie bearbeiten Diagramme und erfassen Beziehungen und Interaktionen zwischen den Knoten im Diagramm.
- Variational Auto-Encoder ist ein generatives Modell, das Darstellungen von Daten lernt, indem es den zugrunde liegenden latenten Raum erfasst. Diese Modelle verwenden eine Encoder-Decoder-Architektur, um Daten in einen niedrigerdimensionalen Raum zu komprimieren und zu rekonstruieren.
- Transformer ist ein Modell, das Selbstaufmerksamkeitsmechanismen nutzt, um kontextuelle Beziehungen zwischen Wörtern in einem Satz oder Dokument zu erfassen.
Es ist wichtig zu beachten, dass die oben genannten Methoden selten isoliert verwendet werden. Stattdessen werden sie über die folgenden Techniken und Algorithmen kombiniert:
- Beim Ensembling werden mehrere Modelle unabhängig voneinander trainiert und anschließend ihre Vorhersagen mithilfe verschiedener Techniken kombiniert. Jedes Modell trägt gleichermaßen zur endgültigen Vorhersage bei, und die Kombination ist in der Regel unkompliziert und erfordert kein Training zusätzlicher Modelle.
- Das Stapeln erfordert einen fortgeschritteneren Ansatz. Dabei werden mehrere Modelle, sogenannte Basismodelle, trainiert und ihre Vorhersagen anschließend über ein Metamodell kombiniert. Die Basismodelle treffen Vorhersagen auf der Grundlage der Eingabedaten und ihre Vorhersagen werden zu Eingabemerkmalen für das Metamodell. Das Metamodell wird dann trainiert, um die endgültige Vorhersage zu treffen.
- AdaBoost ist ein Ensemble-Lernalgorithmus, der die Genauigkeit von Basismodellen verbessert, indem er sie iterativ auf verschiedenen Datenteilmengen trainiert. Der Ansatz konzentriert sich auf die Instanzen, die schwer richtig zu klassifizieren sind, und schenkt ihnen in nachfolgenden Trainingsiterationen mehr Aufmerksamkeit. In jeder Iteration weist AdaBoost den Trainingsinstanzen Gewichtungen basierend auf ihrer Klassifizierungsgenauigkeit zu. Anschließend werden leistungsschwache Modelle anhand der gewichteten Daten trainiert, wobei die Gewichtungen die falsch klassifizierten Instanzen aus früheren Iterationen hervorheben.
- XGBoost ist eine Ensemble-Methode, die schwache Vorhersagemodelle iterativ kombiniert, um ein stärkeres Modell zu erstellen. Es trainiert Modelle nacheinander, wobei jedes nachfolgende Modell die Fehler des vorherigen korrigiert.
Schritt 4: Trainieren und validieren Sie das Modell
Sobald Sie sich auf einen Algorithmus für Ihre Empfehlungsmaschine festgelegt haben, ist es an der Zeit, das Modell zu trainieren und zu validieren. So sieht dieser Schritt beim Aufbau einer Empfehlungsmaschine aus:
Zunächst müssen Sie Ihre Daten in zwei Sätze aufteilen: einen Trainingssatz und einen Testsatz. Wie der Name schon sagt, bringt der Trainingssatz Ihrem Modell bei, Muster in Benutzerpräferenzen zu erkennen. Das Testset hilft dabei, die Leistung des Modells anhand neuer Daten zu bewerten.
Beginnen Sie mit dem Trainingsset mit dem Training Ihres Modells. Dabei wird der Algorithmus den Daten ausgesetzt, sodass er die zugrunde liegenden Muster und Beziehungen lernen kann.
Nach der Trainingsphase ist es an der Zeit, die Leistung des Modells mithilfe des Testsatzes zu bewerten. Dies wird Ihnen helfen zu verstehen, wie effektiv sich das Modell auf neue Daten verallgemeinern lässt.
Alternativ können Sie sich auf Echtzeit-Feedback verlassen, um zu verstehen, wie gut das Modell funktioniert. Auf diese Weise stellen Sie das Modell in der Produktion bereit und ordnen die generierten Empfehlungen dem Benutzerfeedback zu. Anschließend fahren Sie mit dem nächsten Schritt fort, in dem Sie das Modell so einstellen, dass es seine Parameter durch einen iterativen Lernprozess anpasst.
Schritt 5. Optimieren Sie die Hyperparameter des Modells
Nachdem Sie die Leistung des Modells bewertet haben, können Sie es nach Bedarf optimieren. Betrachten wir ein Beispiel eines Empfehlungssystems, das auf einem kollaborativen Filteralgorithmus basiert.
Bei der kollaborativen Filterung bestimmt die Anzahl der Nachbarn, wie viele ähnliche Benutzer oder Elemente bei der Abgabe von Empfehlungen berücksichtigt werden. Angenommen, Sie erstellen eine Empfehlungsmaschine, die auf kollaborativer Filterung basiert und neue Filme vorschlägt. Zunächst legen Sie die Anzahl der Nachbarn auf 10 fest, was bedeutet, dass das Modell bei der Generierung von Empfehlungen die Präferenzen der 10 ähnlichsten Benutzer berücksichtigt.
Nach der Bewertung der Modellleistung stellen Sie fest, dass die Präzision der Empfehlungen geringer ist als gewünscht. Um dies zu verbessern, entscheiden Sie sich für eine Feinabstimmung des Modells, indem Sie die Anzahl der Nachbarn anpassen.
Um die Auswirkungen verschiedener Nachbargrößen zu untersuchen, können Sie Experimente mit Bereichswerten durchführen. Beispielsweise kann die Reduzierung der Anzahl der Nachbarn auf 5 zu einer deutlichen Steigerung der Präzision führen. Möglicherweise stellen Sie jedoch einen leichten Rückgang der Erinnerung fest, was darauf hindeutet, dass dem Modell einige relevante Empfehlungen entgehen. Eine Erhöhung der Zahl 20 wiederum könnte zu einer leichten Verbesserung der Erinnerung führen, Vorschläge könnten jedoch weniger personalisiert werden.
Der Schlüssel liegt darin, einen Kompromiss zwischen Präzision und Erinnerung zu finden und ein Gleichgewicht zwischen der Erfassung verschiedener Benutzerpräferenzen und der Aufrechterhaltung genauer Empfehlungen zu finden.
Schritt 6: Implementieren, überwachen und aktualisieren Sie das Modell
Wenn das Modell vorbereitet und fahrbereit ist, ist es an der Zeit, es umzusetzen.
Um eine erfolgreiche Implementierung sicherzustellen, überlegen Sie, wie Sie das Modell am effektivsten in Ihre bestehende Infrastruktur integrieren können. Sie können das Modell beispielsweise in das Backend Ihrer Website einbetten und so sicherstellen, dass es nahtlos mit der Benutzeroberfläche interagiert. Diese Integration ermöglicht Echtzeitempfehlungen, die sich dynamisch an die Vorlieben der Benutzer anpassen.
Alternativ können Sie das Modell als Dienst bereitstellen, etwa als Empfehlungs-Engine-API, auf den andere Komponenten Ihrer Anwendung problemlos zugreifen können. Dieser serviceorientierte Ansatz gewährleistet Flexibilität und Skalierbarkeit, sodass Ihre Anwendung die Funktionen der Empfehlungs-Engine mühelos nutzen kann.
Die Implementierungsphase ist auch ein guter Zeitpunkt, um darüber nachzudenken, wie die Empfehlungen den Benutzern präsentiert werden. Werden sie als personalisierte Vorschläge auf der Homepage einer Website angezeigt, übersichtlich kategorisiert in einer intuitiven Benutzeroberfläche? Oder werden sie nahtlos in die Benutzeroberfläche der App integriert und tauchen genau im richtigen Moment auf, um Benutzer zu überraschen? Sie haben die Wahl, aber das Benutzererlebnis steht immer im Vordergrund.
Schließlich ist es wichtig, das implementierte Modell gründlich zu testen, um seine reibungslose Funktionalität sicherzustellen. Führen Sie umfassende Tests durch, um die Leistung und das Verhalten bei verschiedenen Benutzerinteraktionen zu validieren und sicherzustellen, dass die Empfehlungen korrekt, zeitnah und an den Benutzererwartungen ausgerichtet sind.
Die Herausforderungen beim Aufbau einer Empfehlungsmaschine und wie man sie löst
Für die Bereitstellung personalisierter und relevanter Empfehlungen ist es von entscheidender Bedeutung, die Herausforderungen beim Aufbau einer Empfehlungsmaschine zu verstehen. Hier ist eine Übersicht über die häufigsten:
Herausforderung 1. Erfolg messen
Eine der größten Herausforderungen beim Aufbau einer Empfehlungsmaschine, die gleich zu Beginn berücksichtigt werden sollte, ist die Definition von Erfolgsmetriken. Mit anderen Worten: Bevor Sie mit dem Sammeln von Daten und dem Training von ML-Algorithmen beginnen, sollten Sie eine zuverlässige Methode erarbeiten, um festzustellen, ob den Benutzern die neu generierten Empfehlungen tatsächlich gefallen. Dies wird Ihren Entwicklungsprozess leiten.
Angenommen, Sie sind eine Streaming-Plattform. Sie können die Anzahl der Likes oder monatlich bezahlten Abonnements zählen, um die Leistung Ihrer Empfehlungsmaschine zu messen. Allerdings ist die Wahrscheinlichkeit groß, dass Ihre Empfehlungen in Ordnung sind, während die Nutzer zögern, ihre Präferenzen explizit anzugeben oder für den Service zu bezahlen.
Die Erfahrung unserer Datenwissenschaftler zeigt, dass das Benutzerverhalten eine zuverlässigere Methode zur Messung der Leistung von Empfehlungssystemen ist. Wir würden nicht daran zweifeln, dass ein Nutzer eine Sendung genossen hat, wenn er sie an einem Abend mehrfach angeschaut hat, selbst ohne ausdrückliches Feedback.
Herausforderung 2. Der Fluch der Dimensionalität
Datendimensionalität bezieht sich auf die Anzahl der Features in einem Datensatz. Mehr Eingabefunktionen machen es oft schwieriger, eine genaue Empfehlungsmaschine zu erstellen. Nehmen wir YouTube als Beispiel. Auf der Plattform koexistieren Milliarden von Videos und Nutzern, und jeder Nutzer sucht nach personalisierten Empfehlungen. Allerdings sind die personellen und rechnerischen Ressourcen begrenzt und kaum jemand möchte stundenlang auf das Laden von Empfehlungen warten.
Um diese Herausforderung zu bewältigen, ist vor der Einführung des Empfehlungsalgorithmus ein zusätzlicher Schritt, die Kandidatengenerierung, erforderlich. Dieser Schritt ermöglicht die Eingrenzung von Milliarden Videos auf beispielsweise Zehntausende. Und diese kleinere Gruppe wird dann zur Generierung von Empfehlungen verwendet.
Zur Kandidatengenerierung werden verschiedene Strategien eingesetzt, wobei die Suche nach dem nächsten Nachbarn die wichtigste ist. Andere gängige Methoden zur Überwindung des Problems der Dimensionalität umfassen die Untersuchung beliebter Kategorien oder Präferenzen, die von Menschen ähnlicher Altersgruppen geteilt werden.
Herausforderung 3. Der Kaltstart
Ein weiteres häufiges Problem beim Aufbau einer Empfehlungs-Engine, das Kaltstart-Rätsel, entsteht, wenn dem System nicht genügend Informationen über einen Benutzer oder ein Element fehlen, was es schwierig macht, genaue Empfehlungen bereitzustellen. Um diese Hürde zu überwinden, müssen Methoden wie kollaborative Filterung, inhaltsbasierte Filterung oder hybride Ansätze eingesetzt werden.
Herausforderung 4. Der lange Schwanz
Empfehlungssysteme können unter einem Phänomen leiden, das als „Long Tail“ bekannt ist. Das bedeutet, dass beliebte Artikel mehr Aufmerksamkeit und Empfehlungen erhalten, während weniger beliebte Artikel von den Nutzern unbemerkt bleiben. Um dieses Problem anzugehen, müssen personalisierte Empfehlungen generiert und individuelle Benutzerpräferenzen berücksichtigt werden.
Herausforderung 5. Der Kaltstart für neue Artikel
Wenn dem System ein neuer Artikel hinzugefügt wird, stehen nur wenige oder gar keine historischen Daten zur Generierung von Empfehlungen zur Verfügung, was die Erstellung relevanter Vorschläge erschwert. Ein Ansatz zur Lösung dieses Problems besteht darin, Inhaltsfilter zu verwenden und Benutzer durch Werbeaktionen oder Werbung aktiv zur Interaktion mit neuen Artikeln zu bewegen.
Herausforderung 6. Der Kaltstart für neue Benutzer
Ebenso verfügen neue Benutzer möglicherweise nicht über ausreichende historische Daten für genaue Empfehlungen. Um diese Herausforderung zu meistern, können Methoden wie inhaltsbasierte Filterung, Feedback-Anfragen und erste Benutzerbefragungen eingesetzt werden.
Herausforderung 7. Datensparsamkeit
In Empfehlungssystemen kommt es häufig zu Datenmangel, wenn viele Benutzer eine kleine Anzahl von Elementen bewerten oder mit ihnen interagieren. Dies stellt eine Herausforderung bei der Vorhersage von Benutzerpräferenzen dar. Um dieses Problem anzugehen, können Matrixfaktorisierungsmethoden verwendet werden, die Dimensionsreduktion, Regularisierung und andere Techniken umfassen.
Etwas zusammenfassen
Der Aufbau einer Empfehlungsmaschine ist eine Reise, die auf Algorithmen, Benutzereinblicken und iterativer Verfeinerung basiert. Von der Definition des Problems über die Auswahl des richtigen Ansatzes über die sorgfältige Datenvorverarbeitung bis hin zum Modelltraining trägt jeder Schritt zur Schaffung eines leistungsstarken Empfehlungssystems bei.
Die Fähigkeit einer Empfehlungsmaschine, Benutzerpräferenzen zu verstehen und maßgeschneiderte Empfehlungen zu liefern, kann ein enormes Potenzial für Ihr Unternehmen bergen. Amazon, YouTube, Spotify und viele andere weniger bekannte, aber nicht weniger erfolgreiche Unternehmen revolutionierten ihre Produkte und steigerten anschließend ihren Umsatz mit maßgeschneiderten Empfehlungen.
Beispielsweise wächst Spotify, eine Musik-Streaming-Plattform, die auf hochgradig personalisierten Empfehlungen als wichtigstem Unterscheidungsmerkmal basiert, ihre Nutzerbasis und Umsätze jedes Jahr weiter. Allein im vierten Quartal 2022 hat das Versprechen, einen neuen Lieblingssong zu entdecken, der Plattform 20 % mehr monatlich aktive Nutzer beschert, was zu 33 Millionen Nettozugängen führt.
Wenn Sie immer noch im Rückstand sind, ist es an der Zeit, die Leistungsfähigkeit der KI zu nutzen und Ihr Benutzererlebnis mit einer benutzerdefinierten Empfehlungs-Engine zu revolutionieren.
Möchten Sie Ihre Lösung mit einer leistungsstarken Empfehlungs-Engine erweitern? Sprechen Sie mit ITRex-Beratern.
Ursprünglich veröffentlicht unter https://itrexgroup.com am 6. Juni 2023.