تكبير عملية بناء محرك التوصية
نشرت: 2023-08-03يتم اكتشاف أكثر من 80٪ من العروض التي يشاهدها الأشخاص على Netflix من خلال محرك توصيات النظام الأساسي. هذا يعني أن غالبية ما تهبط إليه عينك هو نتيجة قرارات تتخذها آلة متطورة.
تعتمد خدمة البث على الذكاء الاصطناعي للنظر في المواضيع الدقيقة داخل المحتوى والتعمق في تفضيلات المشاهدين. ومن الآمن أن نقول: الجهد يؤتي ثماره!
إذا كنت لا تزال وراء المنحنى ولكنك ترغب في تحسين تجربة عملائك مع عملك ، فاستمر في القراءة. في منشور المدونة هذا ، نوجهك خلال عملية إنشاء محرك توصيات ونلقي الضوء على كل ما تحتاج إلى معرفته قبل اللجوء إلى بائعي خدمات الذكاء الاصطناعي.
محركات التوصية 101: أشياء يجب معرفتها قبل الدخول في التطوير
قبل أن نبدأ في كيفية إنشاء محرك توصيات ، دعنا ننظر في الأنواع وحالات الاستخدام وخيارات التنفيذ لأحدها.
تقليديا ، تنقسم أنظمة التوصية إلى فئتين عريضتين: أنظمة التصفية القائمة على المحتوى وأنظمة التصفية التعاونية.
التصفية على أساس المحتوى
تنشئ أنظمة التصفية المستندة إلى المحتوى توصيات بناءً على خصائص أو ميزات المحتوى. بمعنى آخر ، يوصون بمنتجات أو محتوى مشابه لتلك التي أحبها المستخدم أو تفاعل معها من قبل. وبهذه الطريقة ، قد يقترح محرك التوصية "وداعًا للسلاح" للقارئ الذي استمتع بـ "All Quiet on the Western Front" و "Catch-22".
لكن كيف يعرف المحرك العناصر المتشابهة؟ دعونا نلقي نظرة على نهج Netflix لبناء محرك توصيات لفهم ذلك. على الرغم من أن نظام توصيات Netflix ذو طبيعة هجينة ، إلا أنه يعتمد على تشابه المحتوى إلى حد كبير.
لدى خدمة البث فريق من العلامات ، الذين يشاهدون كل جزء جديد من المحتوى ويصنفونه. تتراوح العلامات بشكل كبير من كيفية تعبئة القطعة بالإثارة إلى ما إذا كانت تدور في الفضاء أو نجوم ممثل معين. يتيح تحليل بيانات العلامة مقابل سلوك المشاهد باستخدام خوارزميات التعلم الآلي لمنصة البث معرفة ما هو ملائم حقًا لكل مستخدم.
تصفية التعاونية
تقدم أنظمة التصفية التعاونية توصيات بناءً على ملاحظات المستخدم. تفترض هذه الأنظمة أن المستخدمين الذين استمتعوا بعناصر مماثلة من المحتمل أن يتفاعلوا بشكل مشابه مع المنتجات والمحتوى الجديد.
هناك طريقتان لبناء محرك توصيات يعتمدان على التصفية التعاونية: المستندة إلى المستخدم والقائمة على العناصر.
باستخدام التصفية المستندة إلى المستخدم ، يمكنك إنشاء شرائح من المستخدمين المتشابهين مع التفضيلات المشتركة. لذلك ، من المحتمل أن يُنصح المستخدم بالعنصر الذي يحبه المستخدمون الآخرون من الشريحة. لا تؤخذ ميزات المحتوى بعين الاعتبار.
باستخدام التصفية المستندة إلى العناصر ، يُنشئ المحرك توصيات بناءً على تشابه العناصر التي أحبها المستخدم مع تلك المقترحة. تبدو مشابهة للتصفية القائمة على المحتوى ، أليس كذلك؟ على الرغم من أن كل من أنظمة التصفية القائمة على المحتوى وأنظمة التصفية التعاونية القائمة على العناصر تستخدم تشابه العناصر لتقديم التوصيات ، إلا أنها تختلف في كيفية تحديد ما هو مشابه.
توصي أنظمة التصفية المستندة إلى المحتوى فقط بالعناصر التي تشبه تلك التي أحبها المستخدم بالفعل. باستخدام التصفية التعاونية القائمة على العنصر ، ستتم التوصية بعنصر مشابه لما أعجبك ونال إعجاب المستخدمين في شريحتك أيضًا.
حالات استخدام محركات التوصية
أصبح الحصول على درجة عالية من التخصيص أمرًا ضروريًا يتوقعه المستخدمون ، مما دفع الشركات إلى إثراء تجاربهم عبر الإنترنت من خلال محركات التوصية. القطاعات التي أصبحت فيها محركات التوصية شائعة:
- البيع بالتجزئة والتجارة الإلكترونية: يمكن لمحركات التوصية في التجارة الإلكترونية أن تفعل أي شيء من تصنيف المنتجات إلى اقتراح عناصر جديدة للعملاء لشرائها. من الصعب المبالغة في تقدير التأثير الناجم عن تنفيذ محرك توصية في التجارة الإلكترونية وخدمة العملاء المحسّنة ، والتسويق المحسّن ، وإمكانيات أوسع للبيع التي تأتي معها. على سبيل المثال ، يولد قطب التجارة الإلكترونية المعروف ، أمازون ، 35٪ من إيراداته بمساعدة نظام التوصية الخاص به.
- وسائل الإعلام والترفيه: من تنظيم قوائم التشغيل إلى تقديم اقتراحات مخصصة بناءً على التفاعلات السابقة ، تساعد محركات التوصية الوسائط ومنصات الترفيه على جذب المستخدمين لفترة أطول من خلال عرض محتوى لهم لن يكتشفوه بطريقة أخرى. تعتمد أكبر منصات الوسائط والترفيه ، مثل YouTube و Netflix و Spotify ، بشكل كبير على التوصيات الشخصية التي تم إنشاؤها بواسطة الذكاء الاصطناعي لجذب المستخدمين الجدد والاحتفاظ بهم.
- وسائل التواصل الاجتماعي: يستفيد قطاع وسائل التواصل الاجتماعي من إمكانيات تقديم الاقتراحات الشخصية أيضًا. لمساعدة المستخدمين على اكتشاف صفحات وحسابات مماثلة ، تحث منصات الوسائط الاجتماعية مستخدميها على قضاء المزيد من الوقت في التفاعل مع المحتوى ، مما يؤدي إلى زيادة معدلات النقر إلى الظهور وزيادة الإيرادات.
- الخدمات المصرفية والتمويل: تسمح أنظمة التوصية القائمة على الذكاء الاصطناعي للبنوك بتحليل معاملات المستخدمين وزيادة المبيعات لزيادة الإيرادات. على سبيل المثال ، عندما يشتري مستخدم تذكرة طيران بقيمة 500 دولار ، يفترض محرك التوصية تلقائيًا أنهم يسافرون إلى الخارج ويقترح عليهم شراء حزمة سفر تأمينية.
خيارات التنفيذ للاختيار من بينها
عندما تشرع في رحلة بناء محرك توصيات ، ستواجه العديد من خيارات التنفيذ مع مزاياها واعتباراتها ، وهي:
محركات توصية التوصيل والتشغيل
توفر محركات توصية التوصيل والتشغيل طريقة مريحة وخالية من المتاعب لدمج التوصيات المخصصة في منتجك أو نظامك الأساسي. تأتي معدة مسبقًا ومصممة لتندمج بسلاسة في البنية التحتية الحالية لديك.
تكمن الميزة الرئيسية لمحركات توصية التوصيل والتشغيل في بساطتها وسهولة استخدامها. تم تصميمها عادةً لتكون سهلة الاستخدام ، مما يسمح حتى للجماهير غير الفنية بإعدادها بأقل جهد. تمتد أمثلة محركات التوصية للتوصيل والتشغيل إلى منصات مثل Recombee و Seldon و LiftIgniter.
تأتي محركات التوصية بالتوصيل والتشغيل السلبي مع التخصيص المحدود والقدرة على التكيف. على الرغم من أنها توفر الراحة والسرعة ، إلا أنها قد لا توفر مستوى المرونة والضبط الدقيق الذي توفره الحلول المخصصة.
خدمات التوصية المستندة إلى السحابة المدربة مسبقًا
تسمح محركات التوصية المستندة إلى السحابة بالاستفادة من الموارد الحاسوبية الهائلة وخبرات موفري الخدمات السحابية. توفر خدمات التوصيات هذه عادةً واجهات برمجة تطبيقات سهلة الاستخدام تسمح للمطورين بدمج وظائف التوصية بسهولة في تطبيقاتهم.
تعد محركات التوصية المستندة إلى السحابة قابلة للتطوير بدرجة كبيرة أيضًا ، مما يتيح لها التعامل مع قواعد المستخدمين الكبيرة وأحمال حركة المرور العالية. ميزة أخرى هي التحسين المستمر حيث يتم تحديث النماذج الأساسية وصقلها بواسطة مزودي الخدمة.
يقدم بائعو الخدمات السحابية الرائدون ، مثل Amazon Web Services و Google Cloud Platform و Microsoft Azure ، خدمات توصية مُدربة مسبقًا.
تشمل العوامل التي يجب مراعاتها عند اختيار خدمات التوصيات المستندة إلى السحابة المدربة مسبقًا خصوصية البيانات وقفل البائع ومتطلبات التخصيص. على الرغم من أن هذه الخدمات توفر الراحة والقابلية للتوسع ، إلا أنها قد تكون لها قيود من حيث تخصيص خوارزميات التوصية لتتناسب مع احتياجات عملك المحددة.
محركات التوصية المخصصة
توفر محركات التوصية المخصصة أعلى درجة من المرونة والتحكم ، مما يسمح لك بدمج خوارزميات الملكية ، والاستفادة من المعرفة الخاصة بالمجال ، والنظر في الفروق الدقيقة في بياناتك. يتيح لك الانتقال بالطريقة المخصصة التقاط تعقيدات تفضيلات المستخدم وخصائص العناصر والعوامل السياقية ، مما يؤدي عادةً إلى توصيات أكثر دقة وذات صلة.
ومع ذلك ، في حين أن محركات التوصية المخصصة توفر أكبر قدر من المرونة ، فإنها تتطلب أيضًا موارد تطوير كبيرة وخبرة في التعلم الآلي وجهود صيانة مستمرة. لذلك ، قبل إنشاء محرك توصيات مخصص ، قم بتقييم احتياجات عملك بعناية ، والموارد المتاحة ، والأهداف طويلة المدى.
القاعدة الأساسية هي الذهاب إلى المسار المخصص في السيناريوهات التالية:
- لديك احتياجات عمل فريدة: إذا كان لشركتك متطلبات فريدة لا يمكن تلبيتها بالحلول الجاهزة ، فابدأ حسب الطلب. سيسمح لك بتكييف الخوارزمية وفقًا لمهمتك المحددة. لنفترض أنك منصة تجارة إلكترونية متخصصة تبيع المنتجات الحرفية. قد يكون لديك متطلبات مميزة عندما يتعلق الأمر باقتراح المنتجات: يجب على محرك التوصية مراعاة عوامل مثل ندرة المنتج والحرفية وتفضيلات المستخدم لأنماط أو مواد معينة. من المرجح أن يتيح لك إنشاء محرك توصية من البداية إنشاء توصيات تتوافق مع تفضيلات المستخدمين.
- تريد التحكم الكامل والملكية: يمنحك إنشاء محرك توصية مخصص تحكمًا كاملاً في عملية إنشاء التوصيات بالكامل: من المعالجة المسبقة للبيانات من خلال اختيار الخوارزمية إلى الضبط الدقيق. يسمح لك بالحصول على الملكية الكاملة للنظام وتكييفه مع تطور عملك دون الاعتماد على حلول الجهات الخارجية.
- لديك معرفة خاصة بالمجال: إذا كان لديك خبرة خاصة بالمجال أو الوصول إلى البيانات المتخصصة التي يمكن أن تعزز دقة التوصيات بشكل كبير ، فإن بناء حل مخصص يسمح لك بالاستفادة من هذه المعرفة بشكل فعال. من خلال تطوير محرك توصيات مخصص ، يمكنك دمج ميزات أو قيود خاصة بالمجال قد لا تكون متاحة في الحلول المدربة مسبقًا.
- يتطلب تطبيقك قابلية عالية للتوسع والأداء: إذا كنت تتوقع حجمًا هائلاً من المستخدمين أو العناصر ، أو لديك قيود صارمة على زمن الوصول ، أو تحتاج إلى معالجة مجموعات بيانات كبيرة ومعقدة ، فإن إنشاء محرك توصية مخصص يمنحك المرونة في تصميم النظام وتحسينه إلى أقصى حد قابلية التوسع والأداء. ينطبق الأمر نفسه إذا كنت ترغب في إنشاء توصيات في الوقت الفعلي أو شبه في الوقت الفعلي.
- تريد اكتساب ميزة تنافسية: إذا كانت التوصيات الدقيقة عاملًا أساسيًا للتمييز لمنتجك أو خدمتك ، فقد يمنحك بناء محرك توصية مخصص ميزة تنافسية. يمكن أن يوفر الاستثمار في حل مصمم خصيصًا في هذه الحالة الفرصة لتقديم تجارب فريدة وشخصية ، وتعزيز المشاركة والولاء ورضا العملاء.
إنشاء محرك توصيات مخصص ، خطوة بخطوة
يعد تقديم توصيات مخصصة مهمة يتم حلها عادةً من خلال التعلم الآلي. يمكن استخدام الشبكات العصبية أيضًا ، ولكن دورها يقتصر في الغالب على معالجة بيانات التدريب. فيما يلي الخطوات الأساسية في عملية إنشاء محرك توصية يتشاركه مطورو التعلم الآلي في ITRex.
الخطوة 1. تحديد الاتجاه
بدء التنمية من خلال تحديد الاتجاه لبقية المشروع. تشمل الأشياء الأساسية التي يجب القيام بها في هذه المرحلة ما يلي:
تحديد الأهداف وتحديد نطاق المشروع
حدد بوضوح ما تنوي تحقيقه باستخدام نظام التوصيات ووزن الهدف المحدد مقابل قيود الموارد والميزانية. على سبيل المثال ، إذا كنت ترغب في تحسين مشاركة العملاء وزيادة المبيعات في متجرك عبر الإنترنت ، فيمكنك إبقاء نطاق المشروع مقصورًا على التوصية بالمنتجات للعملاء الذين أجروا عملية شراء بالفعل. الحفاظ على النطاق ضيق للغاية لجهد أقل من بناء محرك توصية يستهدف جميع العملاء ، بينما تظل إمكانية توليد عائد استثمار عالية جدًا.
تقييم مصادر البيانات المتوفرة
يعتمد أداء نظام التوصية بشكل كبير على حجم ونوعية بيانات التدريب. قبل الدخول في التدريب ، قم بتقييم ما إذا كان لديك نقاط بيانات كافية لإنشاء توصيات منها.
تحديد مقاييس الأداء
يعد تحديد مقاييس النجاح أحد التحديات الرئيسية لبناء محرك توصيات يجب أخذها في الاعتبار في البداية. اكتشف طريقة لمعرفة ما إذا كان المستخدمون يستمتعون بالفعل بالتوصيات التي تم إنشاؤها حديثًا قبل أن تبدأ في تدريب خوارزميات ML.
الخطوة 2. اجمع بيانات التدريب
تتمثل الخطوة التالية في عملية بناء نظام توصية مخصص في جمع البيانات وإعدادها لتدريب خوارزميات التعلم الآلي. لبناء نظام توصية موثوق ، تحتاج إلى بيانات كافية حول تفضيلات المستخدم.
اعتمادًا على النهج المتبع في بناء محرك توصيات ، سيتحول تركيزك. عند صياغة نظام تصفية تعاوني ، تتمحور البيانات التي تجمعها حول سلوك المستخدم. باستخدام أنظمة التصفية المستندة إلى المحتوى ، فإنك تركز على ميزات المحتوى التي يحبها المستخدمون.
تصفية التعاونية
قد تأتي البيانات المتعلقة بسلوك المستخدم بأشكال مختلفة:
- ملاحظات المستخدم الصريحة هي أي شيء يتطلب من المستخدم بذل جهد ، مثل كتابة مراجعة أو الإعجاب بجزء من المحتوى أو منتج أو تقديم شكوى أو بدء عملية إرجاع.
- ملاحظات المستخدم الضمنية ، مثل سجل الشراء السابق ، والوقت الذي يقضيه المستخدم في النظر إلى عرض معين ، وعادات المشاهدة / الاستماع ، والتعليقات المتبقية على وسائل التواصل الاجتماعي ، والمزيد.
عند إنشاء محرك توصية ، ننصح بدمج كل من التعليقات الصريحة والضمنية ، حيث يسمح الأخير بالبحث في تفضيلات المستخدم التي قد يحجمون عن الاعتراف بها ، مما يجعل النظام أكثر دقة.
التصفية على أساس المحتوى
عند جمع البيانات لأنظمة التصفية المستندة إلى المحتوى ، من الضروري فهم ميزات المنتج / المحتوى التي يجب الاعتماد عليها عند البحث في ما يحبه المستخدمون.
لنفترض أنك تبني محرك توصية لعشاق الموسيقى. يمكنك الاعتماد على تحليل الطيف لفهم نوع الموسيقى التي يحبها مستخدم معين والتوصية بنغمات ذات مخططات طيفية مماثلة.
بدلاً من ذلك ، يمكنك اختيار كلمات الأغاني كأساس لتوصياتك وتقديم المشورة للأغاني التي تتعامل مع مواضيع متشابهة.
المفتاح هو الاختبار والضبط من أجل فهم أفضل ما يناسبك والاستعداد لتحسين النموذج الأولي باستمرار.
الخطوة 3. تنظيف ومعالجة البيانات
لإنشاء محرك توصيات عالي الأداء ، يجب عليك مراعاة تغيير أذواق المستخدم. بناءً على ما توصي به ، قد لا تكون التقييمات أو التقييمات القديمة ذات صلة.
لمنع عدم الدقة ، ضع في اعتبارك فقط النظر في الميزات التي من المرجح أن تمثل أذواق المستخدم الحالية ، وإزالة البيانات التي لم تعد ذات صلة ، وإضافة المزيد من الأهمية لإجراءات المستخدم الأخيرة بدلاً من الإجراءات القديمة.
الخطوة 4. اختر الخوارزمية المثلى
تتمثل الخطوة التالية في عملية إنشاء محرك توصية في اختيار خوارزمية التعلم الآلي المناسبة لمهمتك. يوصي علماء بيانات ITRex بالنظر في الأمور التالية:
- يقسم عامل المصفوفة مجموعة بيانات كبيرة إلى أجزاء أصغر للكشف عن الأنماط المخفية وأوجه التشابه بين المستخدمين والعناصر.
- يعد عامل الموتر امتدادًا لعامل المصفوفة الذي يمكنه التعامل مع هياكل البيانات عالية الأبعاد التي تسمى الموترات. إنه يلتقط أنماطًا أكثر تعقيدًا عن طريق تحليل الموترات إلى عوامل كامنة ، مما يوفر فهمًا أكثر تفصيلاً لتفاعلات عنصر المستخدم.
- آلات التحليل هي نماذج قوية يمكنها التعامل مع البيانات عالية الأبعاد والمتفرقة. إنها تلتقط التفاعلات بين الميزات ويمكن تطبيقها على مهام التوصية. من خلال النظر في تفاعلات الميزات ، يمكنهم تقديم توصيات دقيقة حتى عندما تكون البيانات غير كاملة.
- تجد نماذج الأحياء أوجه تشابه بين المستخدمين أو العناصر بناءً على السمات أو السلوك. فعالة بشكل خاص للتصفية التعاونية ، فهي تنشئ اتصالات بين المستخدمين أو العناصر في الشبكة وتقدم توصيات بناءً على تفضيلات المستخدمين أو العناصر المتشابهة.
- Random Walk هي خوارزمية قائمة على الرسم البياني تستكشف الروابط بين العناصر أو المستخدمين في الشبكة. من خلال التنقل في الشبكة ، فإنها تلتقط أوجه التشابه بين العناصر أو المستخدمين ، وتقدم التوصيات بناءً على الاتصالات التي تم التقاطها.
- SLIM هي تقنية تستخدم في أنظمة التوصيات لفهم كيفية ارتباط العناصر ببعضها البعض. يركز على إيجاد أنماط في العلاقات بين العناصر ويستخدم تلك الأنماط لتقديم التوصيات.
- تتنبأ النماذج الخطية بتفضيلات عنصر المستخدم بناءً على العلاقات الخطية بين الميزات. في حين أنها سهلة الفهم وسريعة التدريب ، إلا أنها قد لا تلتقط الأنماط المعقدة بفعالية مثل الأساليب الأخرى.
أيضًا ، يمكنك الاختيار من بين نماذج التعلم العميق التالية:
- تتعلم DSSMs (النماذج الدلالية الهيكلية العميقة) تمثيلات النص أو المستندات. يركزون على التقاط المعنى الدلالي للكلمات وعلاقاتهم في إطار منظم.
- تم تصميم الشبكات التلافيفية للرسم البياني للبيانات المهيكلة بالرسوم البيانية. تعمل على الرسوم البيانية ، وتلتقط العلاقات والتفاعلات بين العقد في الرسم البياني.
- التشفير التلقائي المتغير هو نموذج توليدي يتعلم تمثيل البيانات من خلال التقاط المساحة الكامنة الكامنة فيها. تستخدم هذه النماذج بنية وحدة فك التشفير لضغط البيانات في مساحة ذات أبعاد أقل وإعادة بنائها.
- Transformer هو نموذج يستخدم آليات الانتباه الذاتي لالتقاط العلاقات السياقية بين الكلمات في جملة أو وثيقة.
المهم أن نلاحظ أن الطرق المذكورة أعلاه نادرًا ما تستخدم بمعزل عن غيرها. بدلاً من ذلك ، يتم دمجها عبر التقنيات والخوارزميات التالية:
- يتضمن التجميع تدريب نماذج متعددة بشكل مستقل ثم دمج تنبؤاتهم من خلال تقنيات مختلفة. يساهم كل نموذج بالتساوي في التنبؤ النهائي ، وعادة ما يكون الجمع مباشرًا ولا يتضمن تدريب نماذج إضافية.
- التراص يأخذ نهجًا أكثر تقدمًا. يتضمن تدريب نماذج متعددة ، يشار إليها بالنماذج الأساسية ، ثم دمج تنبؤاتهم من خلال نموذج ميتا. تقوم النماذج الأساسية بعمل تنبؤات بناءً على بيانات الإدخال ، وتصبح تنبؤاتها ميزات الإدخال للنموذج التلوي. ثم يتم تدريب النموذج التلوي لعمل التنبؤ النهائي.
- AdaBoost عبارة عن خوارزمية تعلم جماعية تعمل على تحسين دقة النماذج الأساسية من خلال تدريبها بشكل متكرر على مجموعات فرعية مختلفة من البيانات. يركز النهج على الحالات التي يصعب تصنيفها بشكل صحيح ويمنحها مزيدًا من الاهتمام في التكرارات التدريبية اللاحقة. في كل تكرار ، يقوم AdaBoost بتعيين أوزان لمثيلات التدريب بناءً على دقة تصنيفها. ثم يقوم بتدريب النماذج ذات الأداء السيئ على البيانات الموزونة ، حيث تؤكد الأوزان على الحالات التي تم تصنيفها بشكل خاطئ من التكرارات السابقة.
- XGBoost هي طريقة تجميعية تجمع بين نماذج التنبؤ الضعيفة بشكل متكرر لإنشاء نموذج أقوى. يقوم بتدريب النماذج بطريقة متسلسلة ، حيث يقوم كل نموذج لاحق بتصحيح الأخطاء التي ارتكبها النموذج السابق.
الخطوة 4. تدريب النموذج والتحقق منه
بمجرد التركيز على خوارزمية لمحرك التوصيات الخاص بك ، فقد حان الوقت لتدريب النموذج والتحقق منه. إليك كيف تبدو هذه الخطوة في عملية إنشاء محرك توصيات:
للبدء ، تحتاج إلى تقسيم بياناتك إلى مجموعتين: مجموعة تدريب ومجموعة اختبار. مجموعة التدريب ، كما يوحي الاسم ، تعلم النموذج الخاص بك التعرف على الأنماط في تفضيلات المستخدم. تساعد مجموعة الاختبار في تقييم أداء النموذج على البيانات الجديدة.
مع مجموعة التدريب في متناول اليد ، ابدأ في تدريب النموذج الخاص بك. يتضمن ذلك تعريض الخوارزمية للبيانات ، مما يسمح لها بمعرفة الأنماط والعلاقات الأساسية.
بعد مرحلة التدريب ، حان الوقت لتقييم أداء النموذج باستخدام مجموعة الاختبار. سيساعدك هذا على فهم مدى فعالية تعميم النموذج على البيانات الجديدة.
بدلاً من ذلك ، يمكنك الاعتماد على التعليقات في الوقت الفعلي لفهم مدى جودة أداء النموذج. بهذه الطريقة ، يمكنك نشر النموذج في الإنتاج وتعيين التوصيات التي تم إنشاؤها لملاحظات المستخدم. ثم تنتقل إلى الخطوة التالية ، حيث تقوم بتعيين النموذج لضبط معلماته من خلال عملية التعلم التكراري.
الخطوة 5. ضبط النموذج التشعبي
بمجرد تقييم أداء النموذج ، يمكنك ضبطه حسب الحاجة. لنفكر في مثال لنظام توصية مبني على خوارزمية تصفية تعاونية.
في التصفية التعاونية ، يحدد عدد الجيران عدد المستخدمين أو العناصر المتشابهة التي يتم أخذها في الاعتبار عند تقديم التوصيات. افترض أنك تبني محرك توصيات يعتمد على التصفية التعاونية ويقترح أفلامًا جديدة. في البداية ، تقوم بتعيين عدد الجيران على 10 ، مما يعني أن النموذج يأخذ في الاعتبار تفضيلات أكثر 10 مستخدمين تشابهًا عند إنشاء التوصيات.
بعد تقييم أداء النموذج ، تجد أن دقة التوصيات أقل من المطلوب. لتحسين ذلك ، قررت ضبط النموذج عن طريق ضبط عدد الجيران.
لاستكشاف تأثير أحجام الجوار المختلفة ، يمكنك إجراء تجارب باستخدام قيم النطاق. على سبيل المثال ، قد يؤدي تقليل عدد الجيران إلى 5 إلى زيادة كبيرة في الدقة. ومع ذلك ، قد تلاحظ انخفاضًا طفيفًا في الاستدعاء ، مما يشير إلى أن النموذج يفقد بعض التوصيات ذات الصلة. زيادة الرقم 20 ، بدورها ، قد تؤدي إلى تحسن طفيف في الاسترجاع ، لكن الاقتراحات قد تصبح أقل تخصيصًا.
المفتاح هو تسوية حل وسط بين الدقة والاستدعاء وتحقيق التوازن بين التقاط تفضيلات المستخدم المتنوعة والحفاظ على توصيات دقيقة.
الخطوة 6. تنفيذ النموذج ومراقبته وتحديثه
مع تجهيز النموذج وجاهزيته للتشغيل ، فقد حان الوقت لتنفيذه.
لضمان التنفيذ الناجح ، ضع في اعتبارك الطريقة الأكثر فعالية لدمج النموذج في البنية التحتية الحالية. على سبيل المثال ، يمكنك تضمين النموذج في النهاية الخلفية لموقع الويب الخاص بك ، مما يضمن أنه يتفاعل بسلاسة مع واجهة المستخدم. يتيح هذا التكامل توصيات في الوقت الفعلي تتكيف ديناميكيًا مع تفضيلات المستخدمين.
بدلاً من ذلك ، يمكنك نشر النموذج كخدمة ، مثل واجهة برمجة تطبيقات محرك التوصية ، والتي يمكن للمكونات الأخرى لتطبيقك الاتصال بها بسهولة. يضمن هذا النهج الموجه نحو الخدمة المرونة وقابلية التوسع ، مما يسمح لتطبيقك بالاستفادة من إمكانات محرك التوصية دون عناء.
تعد مرحلة التنفيذ أيضًا لحظة رائعة للنظر في كيفية تقديم التوصيات للمستخدمين. هل سيتم عرضها كاقتراحات مخصصة على الصفحة الرئيسية لموقع الويب ، مصنفة بدقة في واجهة سهلة الاستخدام؟ أم سيتم دمجها بسلاسة في واجهة التطبيق ، وستظهر في اللحظة المناسبة لمفاجأة المستخدمين؟ الخيار لك ، ولكن عليك دائمًا الحفاظ على تجربة المستخدم في المقدمة.
أخيرًا ، من الأهمية بمكان إجراء اختبار صارم للنموذج الذي تم تنفيذه لضمان تشغيله بسلاسة. قم بإجراء اختبار شامل للتحقق من أدائه وسلوكه عبر تفاعلات المستخدم المختلفة ، لضمان دقة التوصيات وحسن توقيتها وتوافقها مع توقعات المستخدم.
تحديات بناء محرك توصية وكيفية حلها
يعد فهم تحديات بناء محرك توصيات أمرًا بالغ الأهمية لتقديم توصيات مخصصة وذات صلة. فيما يلي ملخص لأكثرها شيوعًا:
التحدي 1. قياس النجاح
يعد تحديد مقاييس النجاح أحد التحديات الرئيسية لبناء محرك توصيات يجب أخذها في الاعتبار في البداية. بعبارة أخرى ، قبل أن تبدأ في جمع البيانات وتدريب خوارزميات تعلم الآلة ، يجب أن تجد طريقة موثوقة لمعرفة ما إذا كان المستخدمون يستمتعون بالفعل بالتوصيات التي تم إنشاؤها حديثًا. هذا سوف يوجه عملية التطوير الخاصة بك.
لنفترض أنك منصة بث. يمكنك حساب عدد الإعجابات أو الاشتراكات الشهرية المدفوعة لقياس مدى أداء محرك التوصيات الخاص بك. ومع ذلك ، من المحتمل أن تكون توصياتك على ما يرام ، بينما يتردد المستخدمون في تحديد تفضيلاتهم صراحةً أو الدفع مقابل الخدمة.
تُظهر تجربة علماء البيانات لدينا أن سلوك المستخدم هو طريقة أكثر موثوقية لقياس أداء نظام التوصيات. لا نشك في أن المستخدم قد استمتع بعرض ما إذا شاهده بنهم في ليلة واحدة ، حتى مع عدم تقديم تعليقات صريحة.
التحدي الثاني: لعنة الأبعاد
تشير أبعاد البيانات إلى عدد الميزات في مجموعة البيانات. غالبًا ما تجعل المزيد من ميزات الإدخال من الصعب إنشاء محرك توصية دقيق. لنأخذ موقع YouTube كمثال. على النظام الأساسي ، يتعايش المليارات من مقاطع الفيديو والمستخدمين ، ويسعى كل مستخدم للحصول على توصيات مخصصة. ومع ذلك ، فإن الموارد البشرية والحاسوبية محدودة ، وبالكاد يرغب أي شخص في قضاء ساعات في انتظار تحميل التوصيات.
لمواجهة هذا التحدي ، هناك حاجة إلى خطوة إضافية ، إنشاء المرشح ، قبل إطلاق خوارزمية التوصية. تسمح هذه الخطوة بتضييق نطاق المليارات من مقاطع الفيديو إلى عشرات الآلاف على سبيل المثال. ثم يتم استخدام هذه المجموعة الأصغر لتوليد التوصيات.
يتم استخدام استراتيجيات مختلفة ، مع كون البحث عن أقرب الجيران هو الأبرز ، لتوليد المرشحين. تشمل الممارسات الشائعة الأخرى للتغلب على قضية الأبعاد استكشاف الفئات الشعبية أو التفضيلات المشتركة بين الأشخاص من نفس الفئات العمرية.
التحدي الثالث. البداية الباردة
مشكلة أخرى شائعة في عملية بناء محرك توصية ، تنشأ معضلة البداية الباردة عندما يفتقر النظام إلى معلومات كافية حول مستخدم أو عنصر ، مما يجعل تقديم توصيات دقيقة أمرًا صعبًا. يتضمن التغلب على هذه العقبة استخدام طرق مثل التصفية التعاونية أو التصفية القائمة على المحتوى أو الأساليب المختلطة.
التحدي 4. الذيل الطويل
قد تعاني أنظمة التوصية من ظاهرة تعرف باسم "الذيل الطويل". هذا يعني أن العناصر الشائعة تتلقى المزيد من الاهتمام والتوصيات ، بينما تظل العناصر الأقل شيوعًا دون أن يلاحظها أحد من قبل المستخدمين. تتطلب معالجة هذه المشكلة إنشاء توصيات مخصصة وأخذ تفضيلات المستخدم الفردية في الاعتبار.
التحدي 5. البداية الباردة للعناصر الجديدة
عند إضافة عنصر جديد إلى النظام ، فإنه يحتوي على القليل من البيانات التاريخية لإنشاء التوصيات ، مما يجعل من الصعب إنشاء الاقتراحات ذات الصلة. تتمثل إحدى طرق معالجة هذه المشكلة في استخدام عوامل تصفية المحتوى وإشراك المستخدمين بنشاط للتفاعل مع العناصر الجديدة من خلال العروض الترويجية أو الإعلانات.
التحدي 6. البداية الباردة للمستخدمين الجدد
وبالمثل ، قد لا يكون لدى المستخدمين الجدد بيانات تاريخية كافية للحصول على توصيات دقيقة. للتغلب على هذا التحدي ، يمكن استخدام طرق مثل التصفية القائمة على المحتوى وطلبات التعليقات واستطلاعات المستخدم الأولية.
التحدي 7. تناثر البيانات
في أنظمة التوصية ، يعد تباين البيانات أمرًا شائعًا حيث يقوم العديد من المستخدمين بتقييم أو التفاعل مع عدد صغير من العناصر. يشكل هذا تحديًا في التنبؤ بتفضيلات المستخدم. لمعالجة هذه المشكلة ، يمكن استخدام طرق عامل المصفوفة التي تتضمن تقليل الأبعاد ، والتنظيم ، وتقنيات أخرى.
ليتم تلخيصه
إن بناء محرك التوصية هو رحلة تغذيها الخوارزميات ورؤى المستخدم والتحسين التكراري. من تحديد المشكلة إلى اختيار النهج الصحيح من خلال المعالجة المسبقة للبيانات الدقيقة إلى تدريب النموذج ، تساهم كل خطوة في إنشاء نظام توصية قوي.
إن قدرة محرك التوصيات على فهم تفضيلات المستخدم وتقديم توصيات مخصصة يمكن أن تحمل إمكانات هائلة لعملك. أما أمازون ، ويوتيوب ، وسبوتيفاي ، والعديد من الشركات الأخرى الأقل شهرة ، ولكن ليس أقل نجاحًا ، فقد أحدثت ثورة في منتجاتها ، وبالتالي نمت إيراداتها من خلال توصيات مخصصة.
على سبيل المثال ، تستمر Spotify ، وهي منصة دفق الموسيقى التي تعتمد على توصيات مخصصة للغاية كعامل مميز رئيسي ، في تنمية قاعدة مستخدميها وإيراداتها كل عام. في الربع الرابع من عام 2022 فقط ، أدى الوعد باكتشاف أغنية جديدة مفضلة إلى زيادة عدد المستخدمين النشطين شهريًا للمنصة بنسبة 20٪ ، مما أدى إلى 33 مليون إضافة صافية.
إذا كنت لا تزال وراء المنحنى ، فقد حان الوقت لتسخير قوة الذكاء الاصطناعي وإحداث ثورة في تجربة المستخدم الخاصة بك من خلال محرك توصية مخصص.
هل تسعى إلى تحسين الحل الخاص بك باستخدام محرك توصيات قوي؟ تحدث إلى مستشاري ITRex.
نُشر في الأصل على https://itrexgroup.com في 6 يونيو 2023.