การระบุคุณลักษณะส่วนตัวของนิติบุคคล

เผยแพร่แล้ว: 2022-05-13

การระบุคุณสมบัติอัตนัยของ UGC ของหน่วยงาน

สิทธิบัตรที่ได้รับเมื่อเร็ว ๆ นี้เป็นการระบุคุณลักษณะส่วนตัวของหน่วยงาน

ฉันไม่เห็นสิทธิบัตรเกี่ยวกับคุณลักษณะส่วนตัวของเอนทิตีหรือการตอบสนองต่อเอนทิตีเหล่านั้น

แง่มุมที่สำคัญของมันคือเนื้อหาที่ผู้ใช้สร้างขึ้น

เราได้รับแจ้งว่าเนื้อหาที่ผู้ใช้สร้างขึ้น (UGC) กำลังเป็นที่นิยมมากขึ้นบนเว็บเนื่องจากความนิยมที่เพิ่มขึ้นของเครือข่ายสังคมออนไลน์ บล็อก เว็บไซต์บทวิจารณ์ ฯลฯ

เรามักจะเห็นเนื้อหาที่ผู้ใช้ตำหนิในรูปแบบของความคิดเห็น เช่น:

  • ความคิดเห็นโดยผู้ใช้คนแรกเกี่ยวกับเนื้อหาที่แบ่งปันโดยผู้ใช้คนที่สองภายในเครือข่ายสังคม
  • ความคิดเห็นของผู้ใช้ในการตอบกลับบทความในบล็อกของคอลัมนิสต์
  • ความคิดเห็นจากคลิปวิดีโอที่โพสต์บนเว็บไซต์โฮสต์เนื้อหา
  • บทวิจารณ์ (เช่น สินค้า ภาพยนตร์)
  • การกระทำ (เช่น ถูกใจ!, ไม่ชอบ!, +1, การแชร์, บุ๊กมาร์ก, เพลย์ลิสต์ ฯลฯ)
  • ต่อไป

ภายใต้สิทธิบัตรนี้ วิธีการระบุและคาดการณ์คุณลักษณะส่วนตัวสำหรับหน่วยงานต่างๆ (เช่น คลิปสื่อ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ) ได้รับการจัดเตรียม

มันเริ่มต้นด้วย:

  • การระบุแอตทริบิวต์ส่วนตัวชุดแรกสำหรับเอนทิตีแรกตามปฏิกิริยาต่อเอนทิตีแรก (เช่น ความคิดเห็นบนเว็บไซต์ การสาธิตการอนุมัติของเอนทิตีแรก (เช่น "ถูกใจ! ฯลฯ)"
  • การแบ่งปันเอนทิตีแรก
  • บุ๊กมาร์กเอนทิตีแรก
  • การเพิ่มเอนทิตีแรกไปยังเพลย์ลิสต์
  • การฝึกลักษณนาม (เช่น เครื่องสนับสนุนเวกเตอร์, AdaBoost, โครงข่ายประสาทเทียม, ต้นไม้การตัดสินใจบนชุดของการแมปอินพุต-เอาต์พุต โดยที่ชุดของการแมปอินพุต-เอาต์พุตประกอบด้วยการแมปอินพุต-เอาต์พุตที่มีอินพุตเป็นการจัดหาเวกเตอร์คุณลักษณะ สำหรับเอนทิตีแรกซึ่งผลลัพธ์จะขึ้นอยู่กับคุณลักษณะส่วนตัวชุดแรก
  • จัดเตรียมเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่สองให้กับตัวแยกประเภทที่ได้รับการฝึกอบรมเพื่อรับชุดแอตทริบิวต์อัตนัยชุดที่สองสำหรับเอนทิตีที่สอง

หน่วยความจำและตัวประมวลผลได้รับการจัดเตรียมเพื่อระบุและทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตี

สื่อเก็บข้อมูลที่คอมพิวเตอร์อ่านได้มีคำแนะนำที่ทำให้ระบบคอมพิวเตอร์ดำเนินการต่างๆ ได้แก่:

  • การระบุคุณลักษณะส่วนตัวชุดแรกสำหรับเอนทิตีแรกตามปฏิกิริยาต่อเอนทิตีแรก
  • การรับเวกเตอร์คุณลักษณะแรกสำหรับเอนทิตีแรก
  • การฝึกอบรมตัวแยกประเภทบนชุดของการแมปอินพุต-เอาท์พุต โดยที่ชุดของการแมปอินพุต-เอาต์พุตประกอบด้วยการแมปอินพุต-เอาต์พุตซึ่งอินพุตจะอิงตามเวกเตอร์คุณลักษณะแรก และเอาต์พุตจะอิงตามแอตทริบิวต์ส่วนตัวชุดแรก
  • การรับเวกเตอร์คุณลักษณะที่สองสำหรับเอนทิตีที่สอง
  • จัดเตรียมเวกเตอร์คุณลักษณะที่สองให้กับตัวแยกประเภทหลังการฝึกอบรมเพื่อรับชุดแอตทริบิวต์อัตนัยชุดที่สองสำหรับเอนทิตีที่สอง

สิทธิบัตรนี้ระบุคุณลักษณะอัตนัยสำหรับนิติบุคคล = พบได้ที่:

การระบุคุณลักษณะอัตนัยโดยการวิเคราะห์สัญญาณการดูแล
ผู้ประดิษฐ์: Hrishikesh Aradhye และ Sanketh Shetty
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา: 11,328,218
ได้รับ: 10 พฤษภาคม 2022
ยื่น: 6 พฤศจิกายน 2017

เชิงนามธรรม:

ระบบและวิธีการในการระบุและทำนายคุณลักษณะส่วนตัวสำหรับหน่วยงานต่างๆ (เช่น คลิปสื่อ ภาพยนตร์ รายการโทรทัศน์ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ) จะถูกเปิดเผย

ในด้านหนึ่ง คุณลักษณะเชิงอัตวิสัยสำหรับรายการสื่อรายการแรกจะได้รับการระบุตามปฏิกิริยาต่อรายการสื่อรายการแรก และกำหนดคะแนนความเกี่ยวข้องสำหรับคุณสมบัติส่วนบุคคลเกี่ยวกับรายการสื่อรายการแรก

ตัวแยกประเภทได้รับการฝึกอบรมโดยใช้ (i) ข้อมูลเข้าการฝึกอบรมที่ประกอบด้วยชุดของคุณลักษณะสำหรับรายการสื่อแรกและผลลัพธ์เป้าหมายสำหรับข้อมูลการฝึกอบรม ผลลัพธ์เป้าหมายที่ประกอบด้วยคะแนนความเกี่ยวข้องตามลำดับสำหรับแอตทริบิวต์ส่วนตัวของรายการสื่อแรก

การระบุและการทำนายคุณสมบัติอัตนัยสำหรับนิติบุคคล

วิธีการระบุและทำนายคุณลักษณะส่วนตัวสำหรับหน่วยงาน (เช่น คลิปสื่อ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ)

คุณลักษณะอัตนัย (เช่น "น่ารัก" "ตลก" "ยอดเยี่ยม" เป็นต้น) ได้รับการกำหนดและคุณลักษณะส่วนตัวสำหรับเอนทิตีเฉพาะจะได้รับการระบุตามปฏิกิริยาของผู้ใช้ต่อเอนทิตีเช่น:

  • ความคิดเห็นบนเว็บไซต์
  • ชอบ!
  • การแบ่งปันเอนทิตีแรกกับผู้ใช้รายอื่น
  • บูมมาร์กเอนทิตีแรก
  • การเพิ่มเอนทิตีแรกไปยังเพลย์ลิสต์
  • ฯลฯ

คะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์อัตนัยกำหนดเกี่ยวกับเอนทิตี

หากแอตทริบิวต์อัตนัย "น่ารัก" ปรากฏในสัดส่วนที่มีนัยสำคัญของความคิดเห็นสำหรับคลิปวิดีโอ "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องสูง

จากนั้นเอนทิตีจะเชื่อมโยงกับแอตทริบิวต์อัตนัยที่ระบุและคะแนนความเกี่ยวข้อง (เช่น ผ่านแท็กที่ใช้กับเอนทิตี ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)

ขั้นตอนข้างต้นดำเนินการสำหรับแต่ละเอนทิตีในชุดเอนทิตีที่กำหนด (เช่น คลิปวิดีโอในที่เก็บคลิปวิดีโอ เป็นต้น) และการจับคู่แบบผกผันจากแอตทริบิวต์อัตนัยไปยังเอนทิตีในกลุ่มจะสร้างขึ้นตามคุณสมบัติส่วนบุคคลและคะแนนความเกี่ยวข้อง .

การทำแผนที่ผกผันสามารถใช้เพื่อระบุเอนทิตีทั้งหมดในชุดที่ตรงกับแอตทริบิวต์อัตนัยที่กำหนด (เช่น เอนทิตีทั้งหมดที่เชื่อมโยงกับแอตทริบิวต์อัตนัย "ตลก" เป็นต้น) ซึ่งจะทำให้:

  • การดึงข้อมูลเอนทิตีที่เกี่ยวข้องอย่างรวดเร็วเพื่อประมวลผลการค้นหาคำสำคัญ
  • กำลังเติมเพลย์ลิสต์
  • การแสดงโฆษณา
  • การสร้างชุดฝึกอบรมสำหรับลักษณนาม
  • ต่อไป

ตัวแยกประเภท (เช่น เครื่องเวกเตอร์สนับสนุน [SVM], AdaBoost, โครงข่ายประสาทเทียม, โครงสร้างการตัดสินใจ เป็นต้น) ได้รับการฝึกอบรมโดยจัดเตรียมชุดตัวอย่างการฝึก โดยที่อินพุตสำหรับตัวอย่างการฝึกประกอบด้วยเวกเตอร์คุณลักษณะที่ได้รับจาก เอนทิตีเฉพาะ (เช่น เวกเตอร์คุณลักษณะสำหรับวิดีโอคลิป

อาจประกอบด้วยค่าตัวเลขเกี่ยวกับ:

  • สี
  • พื้นผิว
  • ความเข้ม
  • แท็กข้อมูลเมตาที่เชื่อมโยงกับคลิปวิดีโอ
  • ฯลฯ

ผลลัพธ์มีคะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์ส่วนตัวแต่ละรายการในคำศัพท์สำหรับเอนทิตีเฉพาะ

ตัวจำแนกประเภทที่ผ่านการฝึกอบรมสามารถทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตีที่ไม่ได้อยู่ในชุดการฝึก (เช่น คลิปวิดีโอที่อัปโหลดใหม่ บทความข่าวที่ยังไม่ได้รับความคิดเห็น เป็นต้น)

สิทธิบัตรนี้สามารถจำแนกหน่วยงานตามคุณลักษณะส่วนตัวเช่น "ตลก" "น่ารัก" ฯลฯ ตามปฏิกิริยาของผู้ใช้ต่อหน่วยงาน

สิทธิบัตรนี้สามารถปรับปรุงคุณภาพของคำอธิบายเอนทิตี เช่น แท็กสำหรับวิดีโอคลิป ปรับปรุงคุณภาพของการค้นหา และการกำหนดเป้าหมายของโฆษณา

สถาปัตยกรรมระบบเพื่อระบุคุณลักษณะส่วนตัว

สถาปัตยกรรมระบบประกอบด้วย:

  • เครื่องเซิร์ฟเวอร์
  • นิติบุคคลร้านค้า
  • เครื่องไคลเอนต์เชื่อมต่อกับเครือข่าย

เครือข่ายอาจเป็นเครือข่ายสาธารณะ (เช่นอินเทอร์เน็ต) เครือข่ายส่วนตัว (เช่นเครือข่ายท้องถิ่น (LAN) หรือเครือข่ายบริเวณกว้าง (WAN)) หรือรวมกัน

เครื่องไคลเอนต์อาจเป็นเทอร์มินัลไร้สาย (สมาร์ทโฟน ฯลฯ) คอมพิวเตอร์ส่วนบุคคล (PC) แล็ปท็อป คอมพิวเตอร์แท็บเล็ต หรือคอมพิวเตอร์หรืออุปกรณ์สื่อสารอื่น ๆ

เครื่องไคลเอนต์อาจใช้ระบบปฏิบัติการ (OS) ที่จัดการฮาร์ดแวร์และซอฟต์แวร์ของเครื่องไคลเอนต์

เบราว์เซอร์ (ไม่แสดง) อาจทำงานบนเครื่องไคลเอนต์ (เช่น บนระบบปฏิบัติการของเครื่องไคลเอนต์)

เบราว์เซอร์อาจเป็นเว็บเบราว์เซอร์ที่สามารถเข้าถึงหน้าเว็บและเนื้อหาที่เว็บเซิร์ฟเวอร์ให้บริการ

เครื่องไคลเอนต์อาจยังอัปโหลด:

  • หน้าเว็บ
  • คลิปสื่อ
  • รายการบล็อก
  • ลิงค์บทความ
  • ต่อไป

เครื่องเซิร์ฟเวอร์ประกอบด้วยเว็บเซิร์ฟเวอร์และตัวจัดการแอตทริบิวต์ส่วนตัว เว็บเซิร์ฟเวอร์และตัวจัดการแอตทริบิวต์ทางอารมณ์อาจทำงานบนอุปกรณ์ต่างๆ

ร้านค้าเอนทิตีเป็นที่เก็บข้อมูลถาวรที่สามารถจัดเก็บเอนทิตี เช่น คลิปสื่อ (เช่น คลิปวิดีโอ คลิปเสียง คลิปที่มีทั้งวิดีโอและเสียง รูปภาพ ฯลฯ) และรายการเนื้อหาประเภทอื่นๆ (เช่น หน้าเว็บ ข้อความ เอกสารอ้างอิง รีวิวร้านอาหาร บทวิจารณ์ภาพยนตร์ ฯลฯ) ตลอดจนโครงสร้างข้อมูลเพื่อแท็ก จัดระเบียบ และจัดทำดัชนีเอนทิตี

ที่เก็บเอนทิตีอาจโฮสต์โดยอุปกรณ์จัดเก็บข้อมูล เช่น หน่วยความจำหลัก ดิสก์ที่ใช้การจัดเก็บข้อมูลแบบแม่เหล็กหรือแบบออปติคัล เทปหรือฮาร์ดไดรฟ์ NAS, SAN เป็นต้น

ร้านค้าเอนทิตีอาจโฮสต์โดยเซิร์ฟเวอร์ไฟล์ที่เชื่อมต่อกับเครือข่าย ในทางตรงกันข้าม ในการใช้งานอื่น ๆ ที่จัดเก็บเอนทิตีอาจได้รับการโฮสต์โดยหน่วยเก็บข้อมูลถาวรประเภทอื่น เช่น เครื่องเซิร์ฟเวอร์หรือเครื่องอื่นที่เชื่อมต่อกับเครื่องเซิร์ฟเวอร์ผ่านเครือข่าย

เอนทิตีที่จัดเก็บในร้านค้าเอนทิตีอาจรวมเนื้อหาที่ผู้ใช้สร้างขึ้นซึ่งได้รับการอัปโหลดโดยเครื่องไคลเอนต์และอาจรวมถึงเนื้อหาที่ผู้ให้บริการจัดหาให้ เช่น:

  • องค์กรข่าว
  • สำนักพิมพ์
  • ห้องสมุด
  • เร็วๆ นี้

เซิร์ฟเวอร์อาจให้บริการหน้าเว็บและเนื้อหาจากร้านค้าเอนทิตีให้กับลูกค้า

ตัวจัดการแอตทริบิวต์อัตนัย:

  • ระบุแอตทริบิวต์อัตนัยสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ (เช่น ความคิดเห็น ชอบ! การแบ่งปัน บุ๊กมาร์ก เพลย์ลิสต์ ฯลฯ)
  • กำหนดคะแนนความเกี่ยวข้องสำหรับคุณลักษณะส่วนตัวเกี่ยวกับเอนทิตี
  • เชื่อมโยงคุณลักษณะอัตนัยและคะแนนความเกี่ยวข้องกับหน่วยงาน
  • แยกคุณสมบัติต่างๆ เช่น คุณสมบัติของรูปภาพ เช่น สี พื้นผิว และความเข้ม คุณสมบัติด้านเสียง เช่น แอมพลิจูด อัตราส่วนสัมประสิทธิ์สเปกตรัม ลักษณะข้อความ เช่น ความถี่ของคำ ความยาวประโยคเฉลี่ย พารามิเตอร์การจัดรูปแบบ ข้อมูลเมตาที่เกี่ยวข้องกับเอนทิตี เป็นต้น) จากเอนทิตีเพื่อสร้างเวกเตอร์คุณลักษณะ
  • ฝึกลักษณนามตามเวกเตอร์คุณลักษณะและคะแนนความเกี่ยวข้องของคุณลักษณะส่วนตัว
  • ใช้ลักษณนามที่ผ่านการฝึกอบรมเพื่อทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตีใหม่โดยพิจารณาจากเวกเตอร์คุณสมบัติของเอนทิตีใหม่

ผู้จัดการแอตทริบิวต์อัตนัย

ผู้จัดการแอตทริบิวต์อัตนัยอาจเหมือนกับผู้จัดการแอตทริบิวต์อัตนัยและอาจรวมถึง:

  • ตัวระบุแอตทริบิวต์อัตนัย
  • ผู้ทำคะแนนที่เกี่ยวข้อง
  • ตัวแยกคุณสมบัติ
  • ลักษณนาม
  • ที่เก็บข้อมูล
  • .

ส่วนประกอบสามารถรวมกันหรือแยกออกเป็นรายละเอียดเพิ่มเติมได้

ที่เก็บข้อมูลอาจเหมือนกับที่เก็บเอนทิตีหรือที่เก็บข้อมูลอื่น (เช่น บัฟเฟอร์ชั่วคราวหรือที่เก็บข้อมูลถาวร) เพื่อเก็บคำศัพท์เกี่ยวกับแอตทริบิวต์ส่วนบุคคล เอนทิตีที่จะได้รับการประมวลผล เวกเตอร์คุณลักษณะที่เกี่ยวข้องกับเอนทิตี คุณลักษณะส่วนบุคคล และคะแนนความเกี่ยวข้องที่เกี่ยวข้องกับเอนทิตีหรือข้อมูลบางส่วนรวมกัน

Datastore อาจโฮสต์โดยอุปกรณ์จัดเก็บข้อมูล เช่น หน่วยความจำหลัก ดิสก์ที่ใช้หน่วยเก็บข้อมูลแบบแม่เหล็กหรือแบบออปติคัล เทปหรือฮาร์ดไดรฟ์ เป็นต้น

ตัวจัดการแอตทริบิวต์ตามอัตวิสัยจะแจ้งให้ผู้ใช้ทราบถึงประเภทของข้อมูลที่จัดเก็บไว้ในที่เก็บข้อมูลและที่จัดเก็บเอนทิตี และอนุญาตให้ผู้ใช้เลือกที่จะไม่ให้ข้อมูลดังกล่าวรวบรวมและแชร์กับผู้จัดการแอตทริบิวต์ส่วนตัว

ตัวระบุแอตทริบิวต์อัตนัย

ตัวระบุแอตทริบิวต์ส่วนบุคคลระบุแอตทริบิวต์ส่วนตัวสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ต่อเอนทิตี

ตัวระบุแอตทริบิวต์ส่วนบุคคลอาจระบุคุณลักษณะส่วนตัวผ่านการประมวลผลข้อความของความคิดเห็นของผู้ใช้ไปยังเอนทิตีที่โพสต์โดยผู้ใช้บนเว็บไซต์เครือข่ายสังคม

ตัวระบุแอตทริบิวต์อัตนัยอาจระบุแอตทริบิวต์อัตนัยสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ประเภทอื่นๆ ต่อเอนทิตี เช่น:

  • 'ชอบ!' หรือ 'ไม่ชอบ!'
  • การแบ่งปันเอนทิตี
  • บุ๊กมาร์กเอนทิตี
  • การเพิ่มเอนทิตีลงในเพลย์ลิสต์
  • ต่อไป

ตัวระบุแอตทริบิวต์ส่วนบุคคลอาจใช้เกณฑ์เพื่อกำหนดแอตทริบิวต์ที่เกี่ยวข้องกับเอนทิตี (เช่นแอตทริบิวต์ส่วนตัวควรปรากฏในความคิดเห็นอย่างน้อย N เป็นต้น)

ผู้ให้คะแนนความเกี่ยวข้องจะกำหนดคะแนนความเกี่ยวข้องสำหรับคุณลักษณะส่วนตัวเกี่ยวกับเอนทิตี

ตัวอย่างเช่น เมื่อตัวระบุแอตทริบิวต์อัตนัยได้ระบุแอตทริบิวต์อัตนัย "น่ารัก" "ตลก" และ "ยอดเยี่ยม" ตามความคิดเห็นในคลิปสื่อที่โพสต์บนเว็บไซต์เครือข่ายสังคมออนไลน์ ผู้ให้คะแนนความเกี่ยวข้องอาจกำหนดคะแนนความเกี่ยวข้องสำหรับแต่ละอัตนัยทั้งสามนี้ คุณสมบัติขึ้นอยู่กับ:

  • ความถี่ที่คุณลักษณะส่วนตัวเหล่านี้ปรากฏในความคิดเห็น
  • ผู้ใช้เฉพาะที่ให้คุณลักษณะส่วนตัว
  • ต่อไป

ตัวอย่างเช่น หากมี 40 ความคิดเห็นและ "น่ารัก" ปรากฏใน 20 คำ และ "เจ๋ง" ปรากฏใน 8 ความคิดเห็น "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องที่สูงกว่า "ยอดเยี่ยม"

คะแนนความเกี่ยวข้องอาจถูกกำหนดตามสัดส่วนของความคิดเห็นที่แอตทริบิวต์อัตนัยปรากฏ (เช่นคะแนน 0.5 สำหรับ "น่ารัก" และคะแนน 0.2 สำหรับ "ยอดเยี่ยม" เป็นต้น)

ผู้ให้คะแนนความเกี่ยวข้องอาจเก็บเฉพาะคุณลักษณะอัตนัยที่เกี่ยวข้องมากที่สุด k และละทิ้งคุณลักษณะส่วนบุคคลอื่นๆ

ตัวอย่างเช่น สมมติว่าตัวระบุแอตทริบิวต์ส่วนบุคคลระบุคุณลักษณะทางอารมณ์เจ็ดประการที่ปรากฏในความคิดเห็นของผู้ใช้อย่างน้อยสามครั้ง ในกรณีนั้น ตัวอย่างเช่น ผู้ให้คะแนนความเกี่ยวข้องอาจคงไว้เพียงคุณลักษณะเชิงอัตวิสัยห้าประการที่มีคะแนนความเกี่ยวข้องสูงสุด และละทิ้งคุณลักษณะทางอารมณ์อีกสองอย่าง (เช่น โดยการตั้งค่าคะแนนความเกี่ยวข้องเป็นศูนย์ เป็นต้น)

คะแนนความเกี่ยวข้องเป็นตัวเลขปกติระหว่าง 0.0 ถึง 1.0

ตัวแยกคุณลักษณะได้รับเวกเตอร์คุณลักษณะสำหรับเอนทิตีโดยใช้เทคนิคต่างๆ เช่น:

  • การวิเคราะห์องค์ประกอบหลัก
  • การฝังแบบกึ่งกำหนด
  • ไอโซแมปส์
  • สี่เหลี่ยมจัตุรัสน้อยที่สุด
  • ต่อไป

การคำนวณที่เกี่ยวข้องกับการแยกคุณลักษณะของเอนทิตีนั้นดำเนินการโดยตัวแยกคุณลักษณะเอง

ในด้านอื่น ๆ การคำนวณเหล่านี้ดำเนินการโดยเอนทิตีอื่น เช่น ไลบรารีที่ปฏิบัติการได้ของ:

  • รูทีนการประมวลผลภาพที่โฮสต์โดยเครื่องเซิร์ฟเวอร์ [ไม่ปรากฎในรูป]
  • ขั้นตอนการประมวลผลเสียง
  • ขั้นตอนการประมวลผลข้อความ
  • ฯลฯ

ผลลัพธ์จะถูกส่งไปยังตัวแยกคุณลักษณะ

ตัวแยกประเภทเป็นเครื่องเรียนรู้ (เช่น เครื่องเวกเตอร์สนับสนุน [SVM], AdaBoost, เครือข่ายประสาทเทียม, แผนผังการตัดสินใจ เป็นต้น) ที่ยอมรับเวกเตอร์คุณลักษณะที่เกี่ยวข้องกับเอนทิตีและส่งออกคะแนนความเกี่ยวข้อง (เช่น จำนวนจริงระหว่าง 0 และรวม 1 รายการ เป็นต้น) สำหรับแต่ละคุณลักษณะส่วนตัวของคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล

ลักษณนามประกอบด้วยตัวแยกประเภทเดียว

ตัวแยกประเภทอาจรวมถึงตัวแยกประเภทหลายตัว (เช่น ตัวแยกประเภทสำหรับคุณลักษณะเชิงอัตนัยแต่ละตัวในคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล ฯลฯ)

ชุดของตัวอย่างเชิงบวกและเกณฑ์เชิงลบจะถูกรวบรวมสำหรับแต่ละคุณลักษณะส่วนตัวในคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล

ชุดตัวอย่างเชิงบวกสำหรับแอตทริบิวต์อัตนัยอาจรวมถึงเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่เกี่ยวข้องกับคุณลักษณะส่วนบุคคลนั้น

ชุดตัวอย่างเชิงลบสำหรับแอตทริบิวต์อัตนัยอาจรวมถึงเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่ไม่เกี่ยวข้องกับแอตทริบิวต์ส่วนบุคคลนั้น

เมื่อชุดของตัวอย่างเชิงบวกและชุดของเกณฑ์เชิงลบมีขนาดไม่เท่ากัน ชุดที่กว้างกว่าอาจได้รับตัวอย่างเพื่อให้ตรงกับขนาดของกลุ่มที่เล็กกว่า

หลังการฝึกอบรม ตัวแยกประเภทอาจคาดการณ์คุณลักษณะส่วนตัวสำหรับเอนทิตีอื่นๆ ที่ไม่ได้อยู่ในชุดการฝึกโดยจัดเตรียมเวกเตอร์คุณลักษณะสำหรับเอนทิตีเหล่านี้เป็นอินพุตไปยังตัวแยกประเภท

ชุดของคุณลักษณะเชิงอัตวิสัยอาจได้มาจากผลลัพธ์ของตัวแยกประเภทโดยรวมคุณลักษณะทางอารมณ์ทั้งหมดที่มีคะแนนความเกี่ยวข้องที่ไม่เป็นศูนย์ กลุ่มของคะแนนอัตนัยอาจได้มาจากการใช้เกณฑ์ขั้นต่ำสุดกับคะแนนที่เป็นตัวเลข (โดยพิจารณาจากคุณลักษณะส่วนบุคคลทั้งหมดที่มีคะแนนอย่างน้อย พูด 0.2 เป็นสมาชิกของชุด)

การระบุคุณลักษณะส่วนตัวของนิติบุคคล

วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ (เช่น รันบนระบบคอมพิวเตอร์เอนกประสงค์หรือเครื่องเฉพาะ) หรือทั้งสองอย่าง

วิธีการดำเนินการโดยเครื่องเซิร์ฟเวอร์ในขณะที่การใช้งานอื่น ๆ บางอย่างอาจดำเนินการโดยอุปกรณ์อื่น

ส่วนประกอบต่างๆ ของตัวจัดการแอตทริบิวต์ตามอัตวิสัยอาจทำงานบนเครื่องแยกกัน (เช่น ตัวระบุแอตทริบิวต์ส่วนบุคคลและผู้ให้คะแนนความเกี่ยวข้องอาจทำงานบนอุปกรณ์เครื่องหนึ่งในขณะที่ตัวแยกคุณลักษณะและตัวแยกประเภททำงานบนอุปกรณ์อื่น เป็นต้น)

เพื่อความง่ายในการอธิบาย วิธีนี้จะอธิบายและอธิบายเป็นชุดของการกระทำ

แต่การกระทำสามารถเกิดขึ้นได้ในลำดับต่างๆ และกับการกระทำอื่นๆ ที่ไม่ได้นำเสนอและอธิบายไว้ในที่นี้

นอกจากนี้ การกระทำที่มีภาพประกอบอาจไม่จำเป็นต้องติดตั้งวิธีการตามหัวข้อที่เปิดเผยทั้งหมด

นอกจากนี้ ผู้มีทักษะในศิลปวิทยาการแขนงนี้เข้าใจและชื่นชมว่าวิธีการสามารถแสดงเป็นชุดของสถานะที่สัมพันธ์กันผ่านทางไดอะแกรมสถานะหรือเหตุการณ์

นอกจากนี้ ควรได้รับการชื่นชมว่าวิธีการที่เปิดเผยในข้อกำหนดนี้มีความสามารถในการจัดเก็บในบทความของการผลิต เพื่อความสะดวกในการขนส่งและถ่ายโอนวิธีการดังกล่าวไปยังอุปกรณ์คอมพิวเตอร์

คำว่า บทความของการผลิต ตามที่ใช้ในที่นี้ มีจุดมุ่งหมายเพื่อหมายรวมถึงโปรแกรมคอมพิวเตอร์ที่สามารถเข้าถึงได้จากอุปกรณ์ที่คอมพิวเตอร์อ่านได้หรือสื่อบันทึกข้อมูล

คำศัพท์ของคุณลักษณะอัตนัยถูกสร้างขึ้น

ในบางแง่มุม อาจมีการกำหนดคำศัพท์แอตทริบิวต์อัตนัย ในทางตรงกันข้าม ในบางปัจจัย คำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคลอาจสร้างขึ้นโดยอัตโนมัติโดยการรวบรวมคำศัพท์และวลีที่ใช้ในการโต้ตอบของผู้ใช้ต่อเอนทิตี ในทางตรงกันข้าม ในด้านอื่น ๆ คำศัพท์อาจเกิดจากการผสมผสานระหว่างเทคนิคแบบแมนนวลและแบบอัตโนมัติ

คำศัพท์ได้รับการเพาะด้วยคุณลักษณะส่วนตัวจำนวนเล็กน้อยที่คาดว่าจะนำไปใช้กับเอนทิตี คำศัพท์จะขยายเพิ่มขึ้นเมื่อเวลาผ่านไป เนื่องจากมีการระบุคำศัพท์หรือวลีที่ปรากฏในปฏิกิริยาของผู้ใช้ผ่านการประมวลผลคำตอบโดยอัตโนมัติ

คำศัพท์เกี่ยวกับคุณลักษณะส่วนตัวอาจจัดเป็นลำดับชั้น อาจขึ้นอยู่กับ "คุณลักษณะเมตา" ที่เกี่ยวข้องกับคุณลักษณะส่วนบุคคล (เช่น คุณลักษณะส่วนบุคคล "ตลก" อาจมีแอตทริบิวต์เมตาเป็น "แง่บวก" ในขณะที่ประเด็นส่วนตัว "น่าขยะแขยง" อาจมี meta-attribute “เชิงลบ” เป็นต้น)

ชุด S ของเอนทิตี (เช่น เอนทิตีทั้งหมดในร้านค้าเอนทิตี เซ็ตย่อยของเอนทิตีในร้านค้าเอนทิตี ฯลฯ) จะได้รับการประมวลผลล่วงหน้า

ภายใต้แง่มุมหนึ่ง การประมวลผลล่วงหน้าของเอนทิตีประกอบด้วยการระบุปฏิกิริยาของผู้ใช้ต่อเอนทิตี จากนั้นจึงฝึกอบรมตัวแยกประเภทตามการตอบสนอง

เมื่อนิติบุคคลเป็นนิติบุคคลจริง

ควรสังเกตว่าเมื่อเอนทิตีเป็นตัวตนจริง (เช่น บุคคล ร้านอาหาร ฯลฯ) การประมวลผลล่วงหน้าของเอนทิตีนั้นจะดำเนินการผ่าน "พร็อกซีทางไซเบอร์" ที่เกี่ยวข้องกับเอนทิตีทางกายภาพ (เช่น แฟนเพจสำหรับนักแสดงบนเว็บไซต์โซเชียลเน็ตเวิร์ก รีวิวร้านอาหารบนเว็บไซต์ ฯลฯ); แต่แอตทริบิวต์อัตนัยจะถือว่ามีความเกี่ยวข้องกับตัวตน (เช่น นักแสดงหรือร้านอาหาร ไม่ใช่แฟนเพจของนักแสดงหรือรีวิวร้านอาหาร)

ตัวอย่างวิธีการดำเนินการอธิบายโดยละเอียด

รับเอนทิตี E ที่ไม่ได้อยู่ในชุด S (เช่น คลิปวิดีโอที่อัปโหลดใหม่ บทความข่าวที่ยังไม่ได้รับความคิดเห็น เอนทิตีในร้านค้าเอนทิตีที่ไม่รวมอยู่ในชุดการฝึก ฯลฯ)

แอตทริบิวต์หัวเรื่องและคะแนนความเกี่ยวข้องสำหรับเอนทิตี E ได้รับแล้ว

มีการอธิบายการใช้งานวิธีตัวอย่างแรกโดยละเอียดด้านล่าง และอธิบายประสิทธิภาพของวิธีตัวอย่างที่สอง

คุณลักษณะเชิงอัตนัยและคะแนนความเกี่ยวข้องที่ได้รับจะสัมพันธ์กับเอนทิตี E (เช่น โดยการใช้แท็กที่สอดคล้องกับเอนทิตี การเพิ่มเรกคอร์ดในตารางฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)

การดำเนินการยังคงดำเนินต่อไป

ควรสังเกตว่าตัวแยกประเภทอาจได้รับการฝึกอบรมใหม่ (เช่น หลังจากการวนซ้ำทุกๆ 100 ครั้ง ทุกๆ N วัน เป็นต้น) โดยกระบวนการฝึกอบรมใหม่ที่อาจดำเนินการพร้อมกัน

การประมวลผลชุดเอนทิตีล่วงหน้า

วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ (เช่น รันบนระบบคอมพิวเตอร์เอนกประสงค์หรือเครื่องเฉพาะ) หรือทั้งสองอย่าง

วิธีการนี้ได้รับการดำเนินการ ในขณะที่การใช้งานอื่นๆ อาจดำเนินการโดยเครื่องอื่น

ชุดการฝึกจะเริ่มต้นเป็นชุดว่าง เอนทิตี E ได้รับเลือกและลบออกจากชุด S ของเอนทิตี

คุณลักษณะเฉพาะบุคคลสำหรับเอนทิตี E ถูกระบุตามปฏิกิริยาของผู้ใช้ต่อเอนทิตี E (เช่น ความคิดเห็นของผู้ใช้ ชอบ! บุ๊กมาร์ก การแชร์ การเพิ่มลงในเพลย์ลิสต์ ฯลฯ)

การระบุแอตทริบิวต์อัตนัยรวมถึงการประมวลผลความคิดเห็นของผู้ใช้ เช่น โดย:

  • การจับคู่คำในความคิดเห็นของผู้ใช้กับคุณลักษณะส่วนตัวในคำศัพท์
  • รวมการจับคู่คำและเทคนิคการประมวลผลภาษาธรรมชาติอื่นๆ เช่น การวิเคราะห์วากยสัมพันธ์และความหมาย
  • ฯลฯ

หน่วยงานที่เกิดขึ้นใกล้สถานที่

ปฏิกิริยาของผู้ใช้อาจได้รับการรวมสำหรับเอนทิตีที่เกิดขึ้นในหลายสถานที่ เช่น:

  • เอนทิตีที่ปรากฏในเพลย์ลิสต์ของผู้ใช้จำนวนมาก
  • หน่วยงานที่ได้รับการแบ่งปันและปรากฏใน "ฟีดข่าว" ของผู้ใช้จำนวนมากบนเว็บไซต์เครือข่ายสังคม
  • ฯลฯ

สถานที่ต่างๆ อาจได้รับการถ่วงน้ำหนักในการมีส่วนร่วมกับคะแนนความเกี่ยวข้อง โดยพิจารณาจากปัจจัยหลายประการ เช่น

ผู้ใช้รายใดรายหนึ่งที่เกี่ยวข้องกับสถานที่นั้น (เช่น ผู้ใช้เฉพาะรายอาจเป็นผู้มีอำนาจในดนตรีคลาสสิก ดังนั้นความคิดเห็นเกี่ยวกับเอนทิตีในฟีดข่าวของพวกเขาอาจได้รับน้ำหนักมากกว่าความคิดเห็นในฟีดข่าวอื่น ฯลฯ ) ปฏิกิริยาของผู้ใช้ที่ไม่ใช่ข้อความ (เช่น เช่น “ชอบ!”, “ไม่ชอบ!”, “+1” เป็นต้น)

นอกจากนี้ จำนวนสถานที่ที่เอนทิตีปรากฏขึ้นอาจใช้ในการกำหนดคุณลักษณะส่วนตัวและคะแนนความเกี่ยวข้อง (เช่น คะแนนความเกี่ยวข้องสำหรับคลิปวิดีโออาจเพิ่มขึ้นเมื่อคลิปวิดีโออยู่ในเพลย์ลิสต์ของผู้ใช้หลายร้อยรายการ เป็นต้น)

บล็อกดำเนินการโดยตัวระบุแอตทริบิวต์อัตนัย

คะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์อัตนัยกำหนดโดยเอนทิตี E

คะแนนความเกี่ยวข้องจะถูกกำหนดสำหรับคุณลักษณะส่วนตัวโดยพิจารณาจากความถี่ที่คุณลักษณะส่วนบุคคลปรากฏในความคิดเห็นของผู้ใช้ ผู้ใช้ที่ระบุรายละเอียดส่วนตัวในคำพูดของพวกเขา (เช่น ผู้ใช้บางรายอาจทราบจากประสบการณ์ว่ามีความแม่นยำมากขึ้นใน ความคิดเห็นของพวกเขามากกว่าผู้ใช้รายอื่น ฯลฯ )

ตัวอย่างเช่น หากมี 40 ความคิดเห็นและ "น่ารัก" ปรากฏใน 20 คำ และ "เจ๋ง" ปรากฏใน 8 ความคิดเห็น "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องที่สูงกว่า "ยอดเยี่ยม"

คะแนนความเกี่ยวข้องอาจถูกกำหนดตามสัดส่วนของความคิดเห็นที่มีคุณลักษณะส่วนตัวปรากฏ (เช่น คะแนน 0.5 สำหรับ "น่ารัก" และคะแนน 0.2 สำหรับ "ยอดเยี่ยม" เป็นต้น)

ภายใต้แง่มุมหนึ่ง คะแนนความเกี่ยวข้องจะถูกทำให้เป็นมาตรฐานเพื่อให้อยู่ในช่วง [0, 1]

ในบางแง่มุม คุณลักษณะส่วนตัวที่ระบุอาจถูกละทิ้งตามคะแนนความเกี่ยวข้อง (เช่น การรักษาคุณลักษณะทางอารมณ์ k ที่มีคะแนนความเกี่ยวข้องสูงสุด ละทิ้งคุณลักษณะส่วนบุคคลที่มีคะแนนความเกี่ยวข้องต่ำกว่าเกณฑ์ ฯลฯ)

ตัวระบุคุณลักษณะอัตนัย

ควรสังเกตว่าแอตทริบิวต์อัตนัยอาจถูกละทิ้งโดยการตั้งค่าคะแนนความเกี่ยวข้องเป็นศูนย์ในบางแง่มุม

คุณสมบัติอัตนัยและคะแนนความเกี่ยวข้องสัมพันธ์กับเอนทิตี

คุณลักษณะอัตนัยและคะแนนความเกี่ยวข้องสัมพันธ์กับเอนทิตี (เช่น ผ่านการแท็ก รายการในตารางในฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)

ได้รับเวกเตอร์คุณลักษณะสำหรับเอนทิตี E

ในด้านหนึ่ง เวกเตอร์คุณลักษณะสำหรับคลิปวิดีโอหรือภาพนิ่งอาจมีค่าตัวเลขเกี่ยวกับสี พื้นผิว ความเข้ม ฯลฯ ในขณะที่เวกเตอร์คุณลักษณะสำหรับคลิปเสียง (หรือวิดีโอคลิปพร้อมเสียง) อาจรวมค่าตัวเลขเกี่ยวกับแอมพลิจูด , สัมประสิทธิ์สเปกตรัม ฯลฯ ในขณะที่เวกเตอร์คุณลักษณะสำหรับเอกสารข้อความอาจรวมถึง:

  • ค่าตัวเลขเกี่ยวกับความถี่ของคำ
  • ความยาวประโยคเฉลี่ย
  • พารามิเตอร์การจัดรูปแบบ
  • ต่อไป

นี้อาจดำเนินการโดยตัวแยกคุณลักษณะ

เพิ่มคุณสมบัติเวกเตอร์และคะแนนความเกี่ยวข้องที่ได้รับลงในชุดการฝึก

bock ตรวจสอบว่าชุด S ของเอนทิตีว่างเปล่าหรือไม่ ถ้า S ไม่ว่าง การดำเนินการจะดำเนินต่อไป มิฉะนั้น การดำเนินการจะดำเนินการ

ตัวแยกประเภทได้รับการฝึกอบรมจากตัวอย่างทั้งหมดของชุดการฝึก เช่น เวกเตอร์คุณลักษณะของตัวอย่างการฝึกจะได้รับเป็นข้อมูลป้อนเข้าไปยังตัวแยกประเภท และคะแนนความเกี่ยวข้องของแอตทริบิวต์แบบอัตนัยจะได้รับให้เป็นผลลัพธ์

การรับคุณสมบัติอัตนัยและคะแนนความเกี่ยวข้องสำหรับนิติบุคคล

มีการสร้างเวกเตอร์คุณลักษณะสำหรับเอนทิตี E

ตามที่อธิบายไว้ข้างต้น เวกเตอร์คุณลักษณะสำหรับคลิปวิดีโอหรือภาพนิ่งอาจมีค่าตัวเลขเกี่ยวกับสี พื้นผิว ความเข้ม ฯลฯ ในทางตรงกันข้าม เวกเตอร์คุณลักษณะสำหรับคลิปเสียง (หรือวิดีโอคลิปพร้อมเสียง) อาจมีค่าตัวเลข เกี่ยวกับแอมพลิจูด สัมประสิทธิ์สเปกตรัม ฯลฯ ในทางตรงกันข้าม เวกเตอร์คุณลักษณะสำหรับเอกสารข้อความอาจรวมค่าตัวเลขเกี่ยวกับความถี่ของคำ ความยาวประโยคเฉลี่ย พารามิเตอร์การจัดรูปแบบ และอื่นๆ

ตัวแยกประเภทที่ผ่านการฝึกอบรมจัดเตรียมเวกเตอร์คุณลักษณะเพื่อรับคุณลักษณะส่วนตัวที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องสำหรับเอนทิตี E

คุณลักษณะเชิงอัตนัยที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องจะเชื่อมโยงกับเอนทิตี E (เช่น ผ่านแท็กที่ใช้กับเอนทิตี E ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)

วิธีที่สองในการรับคุณสมบัติส่วนตัวและคะแนนที่เกี่ยวข้องสำหรับนิติบุคคล

วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ หรือทั้งสองอย่างรวมกัน

วิธีการนี้ดำเนินการโดยเครื่องเซิร์ฟเวอร์ ในขณะที่วิธีอื่นๆ อาจดำเนินการโดยอุปกรณ์อื่น

มีการสร้างเวกเตอร์คุณลักษณะสำหรับเอนทิตี E ตัวแยกประเภทที่ผ่านการฝึกอบรมจัดเตรียมเวกเตอร์คุณลักษณะเพื่อรับคุณลักษณะส่วนตัวที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องสำหรับเอนทิตี E

แอตทริบิวต์ส่วนตัวที่คาดการณ์ไว้ได้รับการแนะนำแก่ผู้ใช้ (เช่น ผู้ใช้ที่อัปโหลดเอนทิตี ชุดแอตทริบิวต์ส่วนบุคคลที่ได้รับการปรับปรุงจะได้รับจากผู้ใช้ เช่น ผ่านหน้าเว็บที่ผู้ใช้เลือกจากแอตทริบิวต์ที่แนะนำและอาจเป็นไปได้ เพิ่มคุณสมบัติใหม่ ฯลฯ )

คะแนนความเกี่ยวข้องเริ่มต้นสำหรับเอนทิตี

คะแนนความเกี่ยวข้องเริ่มต้นถูกกำหนดให้กับแอตทริบิวต์อัตนัยใหม่ที่เพิ่มโดยผู้ใช้

คะแนนความเกี่ยวข้องเริ่มต้นอาจเป็น 1.0 ในระดับตั้งแต่ 0.0 ถึง 1.0 คะแนนความเกี่ยวข้องเริ่มต้นอาจขึ้นอยู่กับผู้ใช้รายใดรายหนึ่ง (เช่นคะแนน 1.0 เมื่อผู้ใช้ทราบจากประวัติที่ผ่านมาว่าสามารถแนะนำคุณลักษณะได้ดีมาก คะแนน 0.8 เมื่อทราบว่าผู้ใช้ค่อนข้างดีในการแนะนำคุณลักษณะ ฯลฯ)

สาขาที่ถูกบล็อกขึ้นอยู่กับว่าผู้ใช้ลบแอตทริบิวต์อัตนัยที่แนะนำหรือไม่ (เช่นโดยไม่เลือกแอตทริบิวต์)

เอนทิตี E ถูกจัดเก็บเป็นตัวอย่างเชิงลบของแอททริบิวต์ที่ถูกลบออกสำหรับการฝึกซ้ำในอนาคตของตัวแยกประเภท ชุดแอตทริบิวต์ส่วนตัวที่ปรับปรุงแล้วและคะแนนความเกี่ยวข้องที่เกี่ยวข้องจะเชื่อมโยงกับเอนทิตี E (เช่น ผ่านแท็กที่ใช้กับเอนทิตี E ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)