تحديد السمات الذاتية للكيانات

نشرت: 2022-05-13

تحديد السمات الذاتية للكيانات التي ينشئها المستخدمون

تتعلق براءة الاختراع الممنوحة مؤخرًا بتحديد السمات الذاتية للكيانات.

لم أر براءة اختراع حول السمات الشخصية للكيانات أو الردود على تلك الكيانات.

أحد الجوانب المهمة في ذلك هو أنه محتوى من إنشاء المستخدم.

قيل لنا أن المحتوى الذي ينشئه المستخدم (UGC) أصبح أكثر شيوعًا على الويب بسبب الشعبية المتزايدة للشبكات الاجتماعية والمدونات ومواقع المراجعة وما إلى ذلك.

غالبًا ما نرى محتوى المستخدم في شكل تعليقات ، مثل:

  • تعليق من قبل مستخدم أول حول المحتوى المشترك بواسطة مستخدم ثانٍ داخل شبكة اجتماعية
  • تعليقات المستخدم ردًا على مقال في مدونة كاتب عمود
  • تعليق من مقطع فيديو تم نشره على موقع ويب مضيف للمحتوى
  • المراجعات (مثل المنتجات والأفلام)
  • الإجراءات (مثل Like !، لم يعجبني !، +1 ، المشاركة ، وضع إشارة مرجعية ، قائمة التشغيل ، إلخ.)
  • هكذا دواليك

بموجب براءة الاختراع هذه ، يتم توفير طريقة لتحديد السمات الشخصية للكيانات والتنبؤ بها (مثل المقاطع الإعلامية والصور ومقالات الصحف وإدخالات المدونات والأشخاص والمنظمات والشركات التجارية وما إلى ذلك).

يبدأ بـ:

  • تحديد مجموعة أولى من السمات الذاتية لكيان أول بناءً على رد فعل تجاه الكيان الأول (مثل التعليقات على موقع ويب ، أو إثبات الموافقة على الكيان الأول (مثل "Like !، وما إلى ذلك)
  • مشاركة الكيان الأول
  • ارتباط الكيان الأول
  • إضافة الكيان الأول إلى قائمة التشغيل
  • تدريب المصنف (مثل آلة متجه الدعم ، AdaBoost ، شبكة عصبية ، شجرة قرار على مجموعة من تعيينات المدخلات والمخرجات ، حيث تشتمل مجموعة تعيينات المدخلات والمخرجات على تعيين المدخلات والمخرجات الذي يكون إدخاله هو توفير ناقل ميزة للكيان الأول ، الذي يعتمد ناتجه على المجموعة الأولى من السمات الذاتية
  • توفير متجه خاصية لكيان ثانٍ للمُصنف المُدرَّب للحصول على مجموعة ثانية من السمات الذاتية للكيان الثاني

يتم توفير ذاكرة ومعالج لتحديد السمات الذاتية للكيانات والتنبؤ بها.

تحتوي وسيلة التخزين التي يمكن قراءتها على الكمبيوتر على إرشادات تؤدي إلى قيام نظام الكمبيوتر بإجراء عمليات بما في ذلك:

  • تحديد مجموعة أولى من السمات الذاتية لكيان أول بناءً على رد فعل على الكيان الأول
  • الحصول على أول متجه مميز للكيان الأول
  • تدريب المصنف على مجموعة من تعيينات المدخلات والمخرجات ، حيث تشتمل مجموعة تعيينات المدخلات والمخرجات على تعيين المدخلات والمخرجات الذي يعتمد مدخلاته على ناقل الميزة الأول والذي يعتمد مخرجاته على المجموعة الأولى من السمات الذاتية
  • الحصول على ناقل خاصية ثان لكيان ثان
  • تزويد المصنف ، بعد التدريب ، بالناقل المميز الثاني للحصول على مجموعة ثانية من السمات الذاتية للكيان الثاني

تم العثور على براءة الاختراع هذه على السمات الشخصية للكيانات = في:

تحديد السمات الذاتية عن طريق تحليل إشارات المعالجة
المخترعون: هريشيكيش أرادي وسانكيث شيتي
الوكيل: Google LLC
براءة الاختراع الأمريكية: 11328218
تم المنح: 10 مايو 2022
تاريخ التقديم: 6 نوفمبر 2017

خلاصة:

يتم الكشف عن نظام وطريقة لتحديد السمات الذاتية للكيانات والتنبؤ بها (مثل مقاطع الوسائط والأفلام والبرامج التلفزيونية والصور ومقالات الصحف وإدخالات المدونات والأشخاص والمؤسسات والشركات التجارية ، إلخ).

في أحد الجوانب ، يتم تحديد السمات الشخصية لعنصر الوسائط الأول بناءً على رد الفعل تجاه عنصر الوسائط الأول ، ويتم تحديد درجات الملاءمة للصفات الشخصية مع عنصر الوسائط الأول.

يتم تدريب المصنف باستخدام (1) إدخال تدريب يشتمل على مجموعة من الميزات لعنصر الوسائط الأول والمخرج المستهدف لمدخلات التدريب ، ويشتمل الناتج المستهدف على درجات الصلة الخاصة بالسمات الشخصية لعنصر الوسائط الأول.

تحديد السمات الذاتية للكيانات والتنبؤ بها

طرق لتحديد السمات الذاتية للكيانات والتنبؤ بها (مثل مقاطع الوسائط والصور ومقالات الصحف وإدخالات المدونات والأشخاص والمؤسسات والشركات التجارية وما إلى ذلك).

يتم تعريف السمات الذاتية (مثل "لطيف" و "مضحك" و "رائع" ، وما إلى ذلك) ، ويتم تحديد السمات الذاتية لكيان معين بناءً على رد فعل المستخدم تجاه الكيان ، مثل:

  • التعليقات على الموقع
  • مثل!
  • مشاركة الكيان الأول مع مستخدمين آخرين
  • ازدهار الكيان الأول
  • إضافة الكيان الأول إلى قائمة التشغيل
  • إلخ

تحديد درجات الملاءمة للسمات الذاتية حول الكيان

إذا ظهرت السمة الشخصية "جذاب" في نسبة كبيرة من التعليقات لمقطع فيديو ، فقد يتم تعيين درجة ارتباط عالية بكلمة "جذاب".

ثم يتم ربط الكيان بالسمات الذاتية المحددة ودرجات الصلة (مثل عن طريق العلامات المطبقة على الكيان ، عبر إدخالات في جدول قاعدة بيانات علائقية ، وما إلى ذلك).

يتم تنفيذ الإجراء أعلاه لكل كيان في مجموعة معينة من الكيانات (مثل مقاطع الفيديو في مستودع مقاطع الفيديو ، وما إلى ذلك) ، ويتم إنشاء تعيين عكسي من السمات الذاتية للكيانات في المجموعة بناءً على الصفات الشخصية ودرجات الصلة .

يمكن بعد ذلك استخدام التعيين العكسي لتحديد جميع الكيانات في المجموعة التي تطابق سمة ذاتية معينة (مثل جميع الكيانات التي ارتبطت بالسمة الذاتية "Funny" ، وما إلى ذلك) ، وبالتالي تمكين:

  • الاسترجاع السريع للكيانات ذات الصلة لمعالجة عمليات البحث عن الكلمات الرئيسية
  • تعبئة قوائم التشغيل
  • توصيل الإعلانات
  • توليد مجموعات تدريب للمصنف
  • هكذا دواليك

المصنف (مثل آلة متجه الدعم [SVM] ، AdaBoost ، الشبكة العصبية ، شجرة القرار ، إلخ) يتم تدريبه من خلال توفير مجموعة من أمثلة التدريب ، حيث تشتمل المدخلات الخاصة بمثال التدريب على متجه الميزات الذي تم الحصول عليه من كيان معين (مثل ناقل الميزة لمقطع فيديو.

قد تحتوي على قيم عددية حول:

  • اللون
  • نَسِيج
  • شدة
  • علامات البيانات الوصفية المرتبطة بمقطع الفيديو
  • إلخ

يحتوي الناتج على درجات ملاءمة لكل سمة ذاتية في المفردات الخاصة بالكيان المعين.

يمكن للمُصنف المُدرَّب أن يتنبأ بعد ذلك بالسمات الذاتية للكيانات غير الموجودة في مجموعة التدريب (مثل مقطع فيديو تم تحميله حديثًا ، أو مقالة إخبارية لم تتلق أي تعليقات بعد ، وما إلى ذلك).

يمكن لبراءة الاختراع هذه تصنيف الكيانات وفقًا لسمات ذاتية مثل "مضحك" و "لطيف" وما إلى ذلك بناءً على رد فعل المستخدم تجاه الكيانات.

يمكن لبراءة الاختراع هذه تحسين جودة أوصاف الكيانات ، مثل علامات مقطع الفيديو ، وتحسين جودة عمليات البحث واستهداف الإعلانات.

هندسة نظام لتحديد السمات الذاتية

تتضمن بنية النظام:

  • آلة الخادم
  • متجر الكيانات
  • أجهزة العميل متصلة بشبكة

قد تكون الشبكة عامة (مثل الإنترنت) ، أو شبكة خاصة (مثل شبكة المنطقة المحلية (LAN) أو شبكة المنطقة الواسعة (WAN)) ، أو مزيج منها.

قد تكون أجهزة العميل عبارة عن محطات طرفية لاسلكية (هواتف ذكية ، وما إلى ذلك) ، أو أجهزة كمبيوتر شخصية (كمبيوتر شخصي) ، أو أجهزة كمبيوتر محمولة ، أو أجهزة كمبيوتر لوحي ، أو أي أجهزة حوسبة أو اتصالات أخرى.

يجوز لأجهزة العميل تشغيل نظام تشغيل (OS) يدير الأجهزة والبرامج الخاصة بأجهزة العميل.

قد يتم تشغيل متصفح (غير معروض) على أجهزة العميل (مثل نظام تشغيل أجهزة العميل).

قد يكون المستعرض مستعرض ويب يمكنه الوصول إلى صفحات الويب والمحتوى الذي يقدمه خادم الويب.

يمكن لأجهزة العميل أيضًا تحميل:

  • صفحات الانترنت
  • مقاطع الوسائط
  • مداخل بلوق
  • روابط للمقالات
  • هكذا دواليك

يشتمل جهاز الخادم على خادم ويب ومدير سمات شخصي. قد يعمل خادم الويب ومدير السمات العاطفية على أجهزة مختلفة.

مخزن الكيانات هو تخزين دائم قادر على تخزين الكيانات مثل مقاطع الوسائط (مثل مقاطع الفيديو ومقاطع الصوت والمقاطع التي تحتوي على كل من الفيديو والصوت والصور وما إلى ذلك) وأنواع أخرى من عناصر المحتوى (مثل صفحات الويب والنص- المستندات المستندة ، ومراجعات المطاعم ، ومراجعات الأفلام ، وما إلى ذلك) ، بالإضافة إلى هياكل البيانات لوضع علامة على الكيانات وتنظيمها وفهرستها.

قد تتم استضافة مخزن الكيانات بواسطة أجهزة التخزين ، مثل الذاكرة الرئيسية ، أو الأقراص المستندة إلى التخزين المغناطيسي أو البصري ، أو الأشرطة أو محركات الأقراص الثابتة ، و NAS ، و SAN ، وما إلى ذلك.

قد تتم استضافة مخزن الكيانات بواسطة خادم ملفات متصل بالشبكة. في المقابل ، في تطبيقات أخرى ، قد يتم استضافة مخزن الكيانات بواسطة نوع آخر من التخزين الدائم مثل جهاز الخادم أو أجهزة مختلفة مقترنة بجهاز الخادم عبر الشبكة.

قد تتضمن الكيانات المخزنة في مخزن الكيانات محتوى من إنشاء المستخدم يتم تحميله بواسطة أجهزة العميل وقد تتضمن محتوى يوفره مزودو الخدمة مثل:

  • المنظمات الإخبارية
  • الناشرون
  • مكتبات
  • حالا

قد يخدم الخادم صفحات الويب والمحتوى من مخازن الكيان للعملاء.

مدير السمات الذاتية:

  • يحدد السمات الذاتية للكيانات بناءً على رد فعل المستخدم (مثل التعليقات ، إعجاب! ، المشاركة ، وضع إشارة مرجعية ، قائمة التشغيل ، إلخ.)
  • يحدد درجات الملاءمة للسمات الذاتية حول الكيانات
  • ربط السمات الذاتية ودرجات الصلة بالكيانات
  • يستخرج ميزات مثل ميزات الصورة مثل اللون والملمس والشدة ؛ ميزات الصوت مثل السعة ونسب معامل الطيف ؛ الميزات النصية مثل ترددات الكلمات ومتوسط ​​طول الجملة ومعلمات التنسيق ؛ البيانات الوصفية المرتبطة بالكيان ؛ الخ) من الكيانات لتوليد ناقلات السمات
  • يقوم بتدريب المصنف بناءً على متجهات السمات ودرجات ملاءمة السمات الذاتية
  • يستخدم المصنف المدرب للتنبؤ بالسمات الذاتية للكيانات الجديدة بناءً على متجهات المعالم للكيانات الجديدة

مدير السمات الذاتية

قد يكون مدير السمات الذاتية هو نفسه مدير السمات الشخصي وقد يشمل:

  • معرّف السمة الذاتية
  • مسجل الصلة
  • مستخرج الميزة
  • مصنف
  • مخزن البيانات
  • .

يمكن دمج المكونات أو فصلها إلى مزيد من التفاصيل.

قد يكون مخزن البيانات هو نفسه مخزن الكيانات أو مخزن بيانات مختلف (مثل المخزن المؤقت أو مخزن البيانات الدائم) للاحتفاظ بمفردات السمات الشخصية والكيانات التي ستتم معالجتها ومتجهات الميزات المرتبطة بالكيانات والسمات الشخصية ودرجات الصلة بالموضوع المتعلقة بالكيانات ، أو مجموعة من هذه البيانات.

يمكن استضافة Datastore بواسطة أجهزة التخزين ، مثل الذاكرة الرئيسية أو الأقراص المستندة إلى التخزين المغناطيسي أو البصري أو الأشرطة أو محركات الأقراص الثابتة ، إلخ.

يقوم مدير السمات الذاتية بإعلام المستخدمين بأنواع المعلومات المخزنة في مخزن البيانات ومخزن الكيان ويسمح للمستخدمين باختيار عدم جمع هذه المعلومات ومشاركتها مع مدير السمات الشخصية.

معرف السمة الذاتية

يحدد معرف السمة الشخصية السمات الذاتية للكيانات بناءً على رد فعل المستخدم على الكيانات.

قد يحدد معرّف السمة الشخصية السمات الشخصية من خلال المعالجة النصية لتعليقات المستخدمين إلى كيان ينشره المستخدم على أحد مواقع الشبكات الاجتماعية.

قد يحدد معرف السمة الذاتية السمات الذاتية للكيانات بناءً على أنواع أخرى من ردود فعل المستخدم على الكيانات ، مثل:

  • 'مثل!' أو "لم يعجبني!"
  • تقاسم الكيان
  • ارتباط الكيان
  • إضافة الكيان إلى قائمة التشغيل
  • هكذا دواليك

قد يطبق معرّف السمة الشخصية حدودًا لتحديد السمات المرتبطة بكيان ما (مثل السمة الذاتية التي يجب أن تظهر في N من التعليقات على الأقل ، وما إلى ذلك).

يحدد مسجل الصلة درجات الملاءمة للسمات الذاتية حول الكيانات.

على سبيل المثال ، عندما يحدد معرّف السمة الذاتية السمات الشخصية "لطيف" و "مضحك" و "رائع" استنادًا إلى التعليقات على مقطع وسائط تم نشره على أحد مواقع الشبكات الاجتماعية ، فقد يحدد سجل الملاءمة درجات الصلة لكل من هذه السمات الذاتية الثلاثة سمات تستند إلى:

  • معدل تكرار ظهور هذه السمات الذاتية في التعليقات
  • المستخدمون المعينون الذين قدموا السمات الذاتية
  • هكذا دواليك

على سبيل المثال ، إذا كان هناك 40 تعليقًا وظهر "لطيف" في 20 كلمة وظهر "رائع" في 8 تعليقات ، فقد يتم تعيين درجة ملاءمة "لطيف" أعلى من "رائع".

قد يتم تعيين درجات الملاءمة بناءً على نسبة التعليقات التي تظهر فيها سمة شخصية (مثل درجة 0.5 لـ "لطيف" و 0.2 درجة لـ "رائع" ، إلخ).

قد يحتفظ مسجل الملاءمة بالسمات الشخصية الأكثر صلة فقط ويتجاهل السمات الشخصية الأخرى.

على سبيل المثال ، افترض أن معرف السمة الشخصية يحدد سبع سمات عاطفية تظهر في تعليقات المستخدم ثلاث مرات على الأقل. في هذه الحالة ، قد يحتفظ مسجل الملاءمة ، على سبيل المثال ، فقط بالسمات الشخصية الخمس ذات أعلى درجات الملاءمة ويتجاهل السمتين العاطفيتين الأخريين (على سبيل المثال عن طريق تعيين درجات الملاءمة على صفر ، وما إلى ذلك).

درجة الصلة هي رقم طبيعي بين 0.0 و 1.0 ضمناً.

يحصل مستخرج الميزة على ناقل معالم لكيان باستخدام تقنيات مثل:

  • تحليل المكونات الرئيسية
  • حفلات الزفاف شبه المحددة
  • isomaps
  • المربعات الاقل جزئية
  • هكذا دواليك

يتم تنفيذ العمليات الحسابية المرتبطة باستخراج ميزات الكيان بواسطة مستخرج الميزة نفسه.

في بعض الجوانب الأخرى ، يتم تنفيذ هذه الحسابات بواسطة كيان آخر ، مثل مكتبة قابلة للتنفيذ تضم:

  • إجراءات معالجة الصور التي يستضيفها جهاز الخادم [غير موضحة في الأشكال]
  • إجراءات معالجة الصوت
  • إجراءات معالجة النصوص
  • إلخ

يتم تقديم النتائج إلى مستخرج الميزة.

المصنف هو آلة تعلم (مثل آلات ناقلات الدعم [SVMs] و AdaBoost والشبكات العصبية وأشجار القرار وما إلى ذلك) التي تقبل كمدخلات ناقل خاصية مرتبط بكيان ومخرجات درجات الصلة (مثل الرقم الفعلي بين 0 و 1 شامل ، وما إلى ذلك) لكل سمة ذاتية من مفردات السمة الشخصية.

المصنف يتكون من مصنف واحد.

قد يشتمل المصنف على مصنفات متعددة (مثل المصنف لكل سمة ذاتية في مفردات السمة الشخصية ، إلخ).

يتم تجميع مجموعة من الأمثلة الإيجابية والمعايير السلبية لكل سمة ذاتية في مفردات السمة الشخصية.

قد تتضمن مجموعة الأمثلة الإيجابية لسمة ذاتية متجهات السمات للكيانات المرتبطة بهذه السمة الشخصية المعينة.

قد تتضمن مجموعة الأمثلة السلبية لسمة ذاتية متجهات السمات للكيانات التي لم ترتبط بهذه السمة الشخصية المعينة.

عندما تكون مجموعة الأمثلة الإيجابية ومجموعة المعايير السلبية غير متكافئة في الحجم ، فقد يتم أخذ عينات للمجموعة الأكثر شمولاً لتتناسب مع حجم المجموعة الأصغر.

بعد التدريب ، قد يتنبأ المصنف بسمات ذاتية للكيانات الأخرى غير الموجودة في مجموعة التدريب من خلال توفير متجهات الميزات لهذه الكيانات كمدخلات إلى المصنف.

قد يتم الحصول على مجموعة من السمات الذاتية من ناتج المصنف من خلال تضمين جميع السمات العاطفية مع درجات ملاءمة غير صفرية. يمكن الحصول على مجموعة من النقاط الذاتية من خلال تطبيق أقل حد أدنى على الدرجات العددية (من خلال النظر في جميع السمات الشخصية التي لديها درجة على الأقل ، على سبيل المثال ، 0.2 كعضو في المجموعة).

تحديد السمات الذاتية للكيانات

يتم تنفيذ الطريقة من خلال منطق المعالجة الذي قد يشمل الأجهزة (الدوائر ، والمنطق المخصص ، وما إلى ذلك) ، أو البرامج (مثل يتم تشغيلها على نظام كمبيوتر للأغراض العامة أو جهاز مخصص) ، أو كليهما.

يتم تنفيذ الطريقة بواسطة جهاز الخادم ، بينما قد يتم تنفيذ بعض التطبيقات الأخرى بواسطة جهاز آخر.

يمكن تشغيل مكونات مختلفة لمديري السمات الذاتية على أجهزة منفصلة (مثل معرف السمات الشخصية ومسجل الصلة قد يعمل على جهاز واحد بينما يعمل مستخرج ومصنف الميزة على جهاز آخر ، وما إلى ذلك).

لتبسيط الشرح ، يتم تصوير الطريقة ووصفها على أنها سلسلة من الأفعال.

ولكن يمكن أن تحدث الأفعال بأوامر مختلفة ومع أفعال أخرى غير معروضة أو موصوفة هنا.

علاوة على ذلك ، قد لا تكون هناك حاجة إلى جميع الأعمال الموضحة لتثبيت الأساليب حسب الموضوع الذي تم الكشف عنه.

بالإضافة إلى ذلك ، فإن أولئك المهرة في الفن سوف يفهمون ويقدرون أن الطريقة يمكن تمثيلها كسلسلة من الحالات المترابطة عبر مخطط الحالة أو الأحداث.

بالإضافة إلى ذلك ، يجب أن ندرك أن الأساليب التي تم الكشف عنها في هذه المواصفات قادرة على تخزينها في مادة التصنيع لتسهيل نقل ونقل هذه المنهجيات إلى أجهزة الحوسبة.

يُقصد بمصطلح مقال التصنيع ، كما هو مستخدم هنا ، أن يشمل برنامج كمبيوتر يمكن الوصول إليه من أي جهاز يمكن قراءته بواسطة الكمبيوتر أو وسائط تخزين.

يتم إنشاء مفردات السمات الذاتية.

في بعض الجوانب ، قد يتم تحديد مفردات السمة الذاتية. في المقابل ، في بعض العوامل الأخرى ، قد يتم إنشاء مفردات السمات الشخصية بطريقة آلية من خلال جمع المصطلحات والعبارات التي يتم استخدامها في ردود فعل المستخدمين على الكيانات. في المقابل ، في جوانب أخرى ، قد يتم إنشاء المفردات من خلال مزيج من التقنيات اليدوية والآلية.

يتم تصنيف المفردات بعدد صغير من السمات الذاتية المتوقع تطبيقها على الكيانات. يتم توسيع المفردات بمرور الوقت حيث يتم التعرف على المزيد من المصطلحات أو العبارات التي تظهر في ردود فعل المستخدم من خلال المعالجة الآلية للاستجابات.

قد يتم تنظيم مفردات السمة الذاتية بشكل هرمي ، ربما بناءً على "السمات الوصفية" المرتبطة بالسمات الشخصية (مثل السمة الشخصية "مضحك" قد يكون لها سمة وصفية "إيجابية" ، في حين أن النقطة الشخصية "مثيرة للاشمئزاز" قد تحتوي سمة وصفية "سلبية ،" وما إلى ذلك).

تتم معالجة مجموعة S من الكيانات (مثل جميع الكيانات في مخزن الكيانات ، أو مجموعة فرعية من الكيانات في مخزن الكيانات ، وما إلى ذلك) مسبقًا.

تحت أحد الجوانب ، تشتمل المعالجة المسبقة للكيانات على تحديد ردود فعل المستخدم على الكيانات ثم تدريب المصنف بناءً على الردود.

عندما يكون الكيان كيانًا ماديًا فعليًا

وتجدر الإشارة إلى أنه عندما يكون الكيان كيانًا ماديًا فعليًا (مثل شخص أو مطعم أو ما إلى ذلك) ، يتم تنفيذ المعالجة المسبقة للكيان عبر "وكيل إلكتروني" مرتبط بالكيان المادي (مثل صفحة المعجبين لممثل على أحد مواقع الشبكات الاجتماعية ، أو مراجعة مطعم على موقع ويب ، وما إلى ذلك) ؛ ولكن ، يتم اعتبار السمات الذاتية مرتبطة بالكيان نفسه (مثل الممثل أو المطعم ، وليس صفحة المعجبين الخاصة بالممثل أو مراجعة المطعم).

الحصول على مثال على طريقة لأداء وصف بالتفصيل.

يتم استلام الكيان E غير الموجود في المجموعة S (مثل مقطع فيديو تم تحميله حديثًا ، أو مقالة إخبارية لم تتلق أي تعليقات بعد ، أو كيان في مخزن الكيان لم يتم تضمينه في مجموعة التدريب ، وما إلى ذلك).

الحصول على سمات الموضوع ودرجات الصلة للكيان هـ.

يتم وصف تنفيذ أسلوب المثال الأول بالتفصيل أدناه ، ويتم وصف أداء طريقة المثال الثاني.

ترتبط السمات الذاتية ودرجات الصلة التي تم الحصول عليها بالكيان E (مثل تطبيق العلامات المقابلة على الكيان ، وإضافة سجل في جدول قاعدة بيانات علائقية ، وما إلى ذلك).

يستمر التنفيذ مرة أخرى.

وتجدر الإشارة إلى أنه قد يتم إعادة تدريب المصنف (على سبيل المثال بعد كل 100 تكرار للحلقة ، كل N أيام ، وما إلى ذلك) من خلال عملية إعادة التدريب التي قد يتم تنفيذها بشكل متزامن.

المعالجة المسبقة لمجموعة من الكيانات

يتم تنفيذ الطريقة من خلال منطق المعالجة الذي قد يشمل الأجهزة (الدوائر ، والمنطق المخصص ، وما إلى ذلك) ، أو البرامج (مثل يتم تشغيلها على نظام كمبيوتر للأغراض العامة أو جهاز مخصص) ، أو كليهما.

يتم تنفيذ الطريقة ، بينما في بعض التطبيقات الأخرى قد يتم تنفيذها بواسطة جهاز آخر.

يتم تهيئة مجموعة التدريب إلى المجموعة الفارغة. يتم تحديد الكيان E وإزالته من مجموعة S من الكيانات.

يتم تحديد السمات الذاتية للكيان E استنادًا إلى ردود فعل المستخدم على الكيان E (مثل تعليقات المستخدم ، Like! ، الإشارات المرجعية ، المشاركة ، الإضافة إلى قائمة التشغيل ، وما إلى ذلك).

يتضمن تحديد السمات الذاتية إجراء معالجة لتعليقات المستخدم ، مثل:

  • مطابقة الكلمات في تعليقات المستخدم مع السمات الذاتية في المفردات
  • الجمع بين مطابقة الكلمات وتقنيات معالجة اللغة الطبيعية الأخرى مثل التحليل النحوي والدلالي
  • إلخ

الكيانات التي تحدث بالقرب من المواقع

قد يتم تجميع ردود فعل المستخدم للكيانات التي تحدث في العديد من المواقع ، مثل:

  • الكيانات التي تظهر في قوائم تشغيل العديد من المستخدمين
  • الكيانات التي تمت مشاركتها وظهورها في "خلاصات إخبارية" متعددة للمستخدمين على أحد مواقع الشبكات الاجتماعية
  • إلخ

قد يتم ترجيح المواقع المختلفة في مساهمتها في درجات الملاءمة بناءً على مجموعة متنوعة من العوامل ، مثل:

المستخدم المعين المرتبط بالموقع (مثل مستخدم معين قد يكون مرجعًا للموسيقى الكلاسيكية ، وبالتالي قد يتم ترجيح التعليقات حول كيان في ملف الأخبار الخاص بهم أكثر من التعليقات في ملف إخباري آخر ، وما إلى ذلك) ، وردود فعل المستخدم غير النصية (مثل مثل "أعجبني!" ، "لم يعجبني!" ، "+1" ، إلخ.).

بالإضافة إلى ذلك ، يمكن أيضًا استخدام عدد المواقع التي يظهر فيها الكيان في تحديد السمات الشخصية ودرجات الصلة (مثل درجات الملاءمة لمقطع فيديو يمكن زيادةها عندما يكون مقطع الفيديو في مئات قوائم تشغيل المستخدم ، وما إلى ذلك).

يتم تنفيذ الكتلة بواسطة معرف السمة الذاتية.

يتم تحديد درجات الصلة للسمات الشخصية بواسطة الكيان E.

يتم تحديد درجة الملاءمة لسمة ذاتية معينة بناءً على التكرار الذي تظهر به السمة الشخصية في تعليقات المستخدم ، المستخدمين المحددين الذين قدموا التفاصيل الشخصية في كلماتهم (مثل قد يكون بعض المستخدمين معروفين من التجربة أنهم أكثر دقة في تعليقاتهم من المستخدمين الآخرين ، وما إلى ذلك).

على سبيل المثال ، إذا كان هناك 40 تعليقًا وظهر "لطيف" في 20 كلمة وظهر "رائع" في 8 تعليقات ، فقد يتم تعيين درجة ملاءمة "لطيف" أعلى من "رائع".

قد يتم تعيين درجات الملاءمة بناءً على نسبة التعليقات التي تظهر فيها سمة شخصية (مثل درجة 0.5 لـ "لطيف" و 0.2 درجة لـ "رائع" ، إلخ).

تحت أحد الجوانب ، يتم تسوية درجات الملاءمة بحيث تنخفض على فترات زمنية [0 ، 1].

في بعض الجوانب ، قد يتم تجاهل السمات الشخصية المحددة بناءً على درجات ملاءمتها (مثل الاحتفاظ بسمات k العاطفية ذات أعلى درجات الملاءمة ، وتجاهل أي سمة شخصية تقل درجة ملاءمتها عن الحد الأدنى ، وما إلى ذلك).

معرّف السمات الذاتية

وتجدر الإشارة إلى أنه قد يتم تجاهل السمة الذاتية عن طريق تعيين درجة ملاءمتها إلى الصفر في بعض الجوانب.

السمات الذاتية ودرجات الصلة مرتبطة بالكيانات

ترتبط السمات الذاتية ودرجات الصلة بالكيانات (مثل عن طريق وضع العلامات ، والإدخالات في جدول في قاعدة بيانات علائقية ، وما إلى ذلك).

يتم الحصول على ناقل ميزة للكيان E.

في أحد الجوانب ، قد يحتوي متجه الميزة لمقطع فيديو أو صورة ثابتة على قيم عددية حول اللون ، والملمس ، والشدة ، وما إلى ذلك ، بينما قد يتضمن متجه الميزة لمقطع صوتي (أو مقطع فيديو به صوت) قيمًا رقمية حول السعة ، المعاملات الطيفية ، وما إلى ذلك ، بينما قد يتضمن متجه الميزة لمستند نصي ما يلي:

  • القيم العددية حول ترددات الكلمات
  • متوسط ​​طول الجملة
  • معلمات التنسيق
  • هكذا دواليك

قد يتم تنفيذ ذلك بواسطة مستخرج الميزة.

تتم إضافة ناقل الميزة ودرجات الصلة التي تم الحصول عليها إلى مجموعة التدريب.

يتحقق bock مما إذا كانت مجموعة الكيانات S فارغة ؛ إذا كانت S غير فارغة ، يستمر التنفيذ ، وإلا فسيتم التنفيذ.

يتم تدريب المصنف على جميع أمثلة مجموعة التدريب ، مثل توفير متجه الميزة لمثال التدريب كمدخل إلى المصنف ، ويتم توفير درجات ملاءمة السمة الذاتية كناتج.

الحصول على السمات الذاتية ودرجات الصلة لأحد الكيانات

يتم إنشاء ناقل ميزة للكيان E.

كما هو موضح أعلاه ، قد يحتوي متجه الميزة لمقطع فيديو أو صورة ثابتة على قيم عددية حول اللون ، والملمس ، والشدة ، وما إلى ذلك. وعلى النقيض من ذلك ، قد يتضمن متجه الميزة لمقطع صوتي (أو مقطع فيديو مع صوت) قيمًا رقمية حول السعة والمعاملات الطيفية ، وما إلى ذلك. على النقيض من ذلك ، قد يشتمل متجه الميزات لمستند نصي على قيم عددية حول ترددات الكلمات ومتوسط ​​طول الجملة ومعلمات التنسيق وما إلى ذلك.

يوفر المصنف المدرب متجه الميزة للحصول على السمات الذاتية المتوقعة ودرجات الصلة للكيان E.

ترتبط السمات الذاتية المتوقعة ودرجات الصلة بالكيان E (مثل العلامات المطبقة على الكيان E ، عبر إدخالات في جدول قاعدة بيانات علائقية ، وما إلى ذلك).

طريقة ثانية للحصول على السمات الذاتية ودرجات الصلة لكيان ما

يتم تنفيذ الطريقة من خلال منطق المعالجة الذي قد يشمل الأجهزة (الدوائر ، والمنطق المخصص ، وما إلى ذلك) ، أو البرامج ، أو كليهما.

يتم تنفيذ الطريقة بواسطة جهاز الخادم ، بينما قد يتم تنفيذ البعض الآخر بواسطة جهاز آخر.

يتم إنشاء ناقل ميزة للكيان E. يوفر المصنف المدرب متجه الميزة للحصول على السمات الذاتية المتوقعة ودرجات الصلة للكيان E.

يتم اقتراح السمات الذاتية المتوقعة التي تم الحصول عليها للمستخدم (مثل المستخدم الذي قام بتحميل الكيان. يتم الحصول على مجموعة مُحسَّنة من السمات الشخصية من المستخدم ، مثل عبر صفحة ويب يختار فيها المستخدم من بين السمات المقترحة وربما يضيف سمات جديدة ، وما إلى ذلك).

درجة الارتباط الافتراضية للكيانات

يتم تعيين درجة الصلة الافتراضية لأي سمات ذاتية جديدة تمت إضافتها بواسطة المستخدم.

قد تكون درجة الملاءمة الافتراضية 1.0 على مقياس من 0.0 إلى 1.0 ، وقد تعتمد درجة الملاءمة الافتراضية على مستخدم معين (مثل الدرجة 1.0 عندما يكون المستخدم معروفًا من التاريخ السابق أنه جيد جدًا في اقتراح السمات ، النتيجة 0.8 عندما يكون من المعروف أن المستخدم جيد إلى حد ما في اقتراح السمات ، وما إلى ذلك).

تستند الفروع Block إلى ما إذا كان المستخدم قد أزال أيًا من السمات الذاتية المقترحة (مثل عدم تحديد السمة).

يتم تخزين الكيان E كمثال سلبي للسمة (السمات) التي تمت إزالتها لإعادة تدريب المصنف في المستقبل. ترتبط المجموعة المكررة من السمات الذاتية ودرجات الصلة المقابلة بالكيان E (مثل عن طريق العلامات المطبقة على الكيان E ، عبر إدخالات في جدول قاعدة بيانات علائقية ، وما إلى ذلك).