การระบุคุณลักษณะส่วนตัวของนิติบุคคล
เผยแพร่แล้ว: 2022-05-13การระบุคุณสมบัติอัตนัยของ UGC ของหน่วยงาน
สิทธิบัตรที่ได้รับเมื่อเร็ว ๆ นี้เป็นการระบุคุณลักษณะส่วนตัวของหน่วยงาน
ฉันไม่เห็นสิทธิบัตรเกี่ยวกับคุณลักษณะส่วนตัวของเอนทิตีหรือการตอบสนองต่อเอนทิตีเหล่านั้น
แง่มุมที่สำคัญของมันคือเนื้อหาที่ผู้ใช้สร้างขึ้น
เราได้รับแจ้งว่าเนื้อหาที่ผู้ใช้สร้างขึ้น (UGC) กำลังเป็นที่นิยมมากขึ้นบนเว็บเนื่องจากความนิยมที่เพิ่มขึ้นของเครือข่ายสังคมออนไลน์ บล็อก เว็บไซต์บทวิจารณ์ ฯลฯ
เรามักจะเห็นเนื้อหาที่ผู้ใช้ตำหนิในรูปแบบของความคิดเห็น เช่น:
- ความคิดเห็นโดยผู้ใช้คนแรกเกี่ยวกับเนื้อหาที่แบ่งปันโดยผู้ใช้คนที่สองภายในเครือข่ายสังคม
- ความคิดเห็นของผู้ใช้ในการตอบกลับบทความในบล็อกของคอลัมนิสต์
- ความคิดเห็นจากคลิปวิดีโอที่โพสต์บนเว็บไซต์โฮสต์เนื้อหา
- บทวิจารณ์ (เช่น สินค้า ภาพยนตร์)
- การกระทำ (เช่น ถูกใจ!, ไม่ชอบ!, +1, การแชร์, บุ๊กมาร์ก, เพลย์ลิสต์ ฯลฯ)
- ต่อไป
ภายใต้สิทธิบัตรนี้ วิธีการระบุและคาดการณ์คุณลักษณะส่วนตัวสำหรับหน่วยงานต่างๆ (เช่น คลิปสื่อ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ) ได้รับการจัดเตรียม
มันเริ่มต้นด้วย:
- การระบุแอตทริบิวต์ส่วนตัวชุดแรกสำหรับเอนทิตีแรกตามปฏิกิริยาต่อเอนทิตีแรก (เช่น ความคิดเห็นบนเว็บไซต์ การสาธิตการอนุมัติของเอนทิตีแรก (เช่น "ถูกใจ! ฯลฯ)"
- การแบ่งปันเอนทิตีแรก
- บุ๊กมาร์กเอนทิตีแรก
- การเพิ่มเอนทิตีแรกไปยังเพลย์ลิสต์
- การฝึกลักษณนาม (เช่น เครื่องสนับสนุนเวกเตอร์, AdaBoost, โครงข่ายประสาทเทียม, ต้นไม้การตัดสินใจบนชุดของการแมปอินพุต-เอาต์พุต โดยที่ชุดของการแมปอินพุต-เอาต์พุตประกอบด้วยการแมปอินพุต-เอาต์พุตที่มีอินพุตเป็นการจัดหาเวกเตอร์คุณลักษณะ สำหรับเอนทิตีแรกซึ่งผลลัพธ์จะขึ้นอยู่กับคุณลักษณะส่วนตัวชุดแรก
- จัดเตรียมเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่สองให้กับตัวแยกประเภทที่ได้รับการฝึกอบรมเพื่อรับชุดแอตทริบิวต์อัตนัยชุดที่สองสำหรับเอนทิตีที่สอง
หน่วยความจำและตัวประมวลผลได้รับการจัดเตรียมเพื่อระบุและทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตี
สื่อเก็บข้อมูลที่คอมพิวเตอร์อ่านได้มีคำแนะนำที่ทำให้ระบบคอมพิวเตอร์ดำเนินการต่างๆ ได้แก่:
- การระบุคุณลักษณะส่วนตัวชุดแรกสำหรับเอนทิตีแรกตามปฏิกิริยาต่อเอนทิตีแรก
- การรับเวกเตอร์คุณลักษณะแรกสำหรับเอนทิตีแรก
- การฝึกอบรมตัวแยกประเภทบนชุดของการแมปอินพุต-เอาท์พุต โดยที่ชุดของการแมปอินพุต-เอาต์พุตประกอบด้วยการแมปอินพุต-เอาต์พุตซึ่งอินพุตจะอิงตามเวกเตอร์คุณลักษณะแรก และเอาต์พุตจะอิงตามแอตทริบิวต์ส่วนตัวชุดแรก
- การรับเวกเตอร์คุณลักษณะที่สองสำหรับเอนทิตีที่สอง
- จัดเตรียมเวกเตอร์คุณลักษณะที่สองให้กับตัวแยกประเภทหลังการฝึกอบรมเพื่อรับชุดแอตทริบิวต์อัตนัยชุดที่สองสำหรับเอนทิตีที่สอง
สิทธิบัตรนี้ระบุคุณลักษณะอัตนัยสำหรับนิติบุคคล = พบได้ที่:
การระบุคุณลักษณะอัตนัยโดยการวิเคราะห์สัญญาณการดูแล
ผู้ประดิษฐ์: Hrishikesh Aradhye และ Sanketh Shetty
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา: 11,328,218
ได้รับ: 10 พฤษภาคม 2022
ยื่น: 6 พฤศจิกายน 2017
เชิงนามธรรม:
ระบบและวิธีการในการระบุและทำนายคุณลักษณะส่วนตัวสำหรับหน่วยงานต่างๆ (เช่น คลิปสื่อ ภาพยนตร์ รายการโทรทัศน์ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ) จะถูกเปิดเผย
ในด้านหนึ่ง คุณลักษณะเชิงอัตวิสัยสำหรับรายการสื่อรายการแรกจะได้รับการระบุตามปฏิกิริยาต่อรายการสื่อรายการแรก และกำหนดคะแนนความเกี่ยวข้องสำหรับคุณสมบัติส่วนบุคคลเกี่ยวกับรายการสื่อรายการแรก
ตัวแยกประเภทได้รับการฝึกอบรมโดยใช้ (i) ข้อมูลเข้าการฝึกอบรมที่ประกอบด้วยชุดของคุณลักษณะสำหรับรายการสื่อแรกและผลลัพธ์เป้าหมายสำหรับข้อมูลการฝึกอบรม ผลลัพธ์เป้าหมายที่ประกอบด้วยคะแนนความเกี่ยวข้องตามลำดับสำหรับแอตทริบิวต์ส่วนตัวของรายการสื่อแรก
การระบุและการทำนายคุณสมบัติอัตนัยสำหรับนิติบุคคล
วิธีการระบุและทำนายคุณลักษณะส่วนตัวสำหรับหน่วยงาน (เช่น คลิปสื่อ รูปภาพ บทความในหนังสือพิมพ์ รายการในบล็อก บุคคล องค์กร ธุรกิจการค้า ฯลฯ)
คุณลักษณะอัตนัย (เช่น "น่ารัก" "ตลก" "ยอดเยี่ยม" เป็นต้น) ได้รับการกำหนดและคุณลักษณะส่วนตัวสำหรับเอนทิตีเฉพาะจะได้รับการระบุตามปฏิกิริยาของผู้ใช้ต่อเอนทิตีเช่น:
- ความคิดเห็นบนเว็บไซต์
- ชอบ!
- การแบ่งปันเอนทิตีแรกกับผู้ใช้รายอื่น
- บูมมาร์กเอนทิตีแรก
- การเพิ่มเอนทิตีแรกไปยังเพลย์ลิสต์
- ฯลฯ
คะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์อัตนัยกำหนดเกี่ยวกับเอนทิตี
หากแอตทริบิวต์อัตนัย "น่ารัก" ปรากฏในสัดส่วนที่มีนัยสำคัญของความคิดเห็นสำหรับคลิปวิดีโอ "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องสูง
จากนั้นเอนทิตีจะเชื่อมโยงกับแอตทริบิวต์อัตนัยที่ระบุและคะแนนความเกี่ยวข้อง (เช่น ผ่านแท็กที่ใช้กับเอนทิตี ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)
ขั้นตอนข้างต้นดำเนินการสำหรับแต่ละเอนทิตีในชุดเอนทิตีที่กำหนด (เช่น คลิปวิดีโอในที่เก็บคลิปวิดีโอ เป็นต้น) และการจับคู่แบบผกผันจากแอตทริบิวต์อัตนัยไปยังเอนทิตีในกลุ่มจะสร้างขึ้นตามคุณสมบัติส่วนบุคคลและคะแนนความเกี่ยวข้อง .
การทำแผนที่ผกผันสามารถใช้เพื่อระบุเอนทิตีทั้งหมดในชุดที่ตรงกับแอตทริบิวต์อัตนัยที่กำหนด (เช่น เอนทิตีทั้งหมดที่เชื่อมโยงกับแอตทริบิวต์อัตนัย "ตลก" เป็นต้น) ซึ่งจะทำให้:
- การดึงข้อมูลเอนทิตีที่เกี่ยวข้องอย่างรวดเร็วเพื่อประมวลผลการค้นหาคำสำคัญ
- กำลังเติมเพลย์ลิสต์
- การแสดงโฆษณา
- การสร้างชุดฝึกอบรมสำหรับลักษณนาม
- ต่อไป
ตัวแยกประเภท (เช่น เครื่องเวกเตอร์สนับสนุน [SVM], AdaBoost, โครงข่ายประสาทเทียม, โครงสร้างการตัดสินใจ เป็นต้น) ได้รับการฝึกอบรมโดยจัดเตรียมชุดตัวอย่างการฝึก โดยที่อินพุตสำหรับตัวอย่างการฝึกประกอบด้วยเวกเตอร์คุณลักษณะที่ได้รับจาก เอนทิตีเฉพาะ (เช่น เวกเตอร์คุณลักษณะสำหรับวิดีโอคลิป
อาจประกอบด้วยค่าตัวเลขเกี่ยวกับ:
- สี
- พื้นผิว
- ความเข้ม
- แท็กข้อมูลเมตาที่เชื่อมโยงกับคลิปวิดีโอ
- ฯลฯ
ผลลัพธ์มีคะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์ส่วนตัวแต่ละรายการในคำศัพท์สำหรับเอนทิตีเฉพาะ
ตัวจำแนกประเภทที่ผ่านการฝึกอบรมสามารถทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตีที่ไม่ได้อยู่ในชุดการฝึก (เช่น คลิปวิดีโอที่อัปโหลดใหม่ บทความข่าวที่ยังไม่ได้รับความคิดเห็น เป็นต้น)
สิทธิบัตรนี้สามารถจำแนกหน่วยงานตามคุณลักษณะส่วนตัวเช่น "ตลก" "น่ารัก" ฯลฯ ตามปฏิกิริยาของผู้ใช้ต่อหน่วยงาน
สิทธิบัตรนี้สามารถปรับปรุงคุณภาพของคำอธิบายเอนทิตี เช่น แท็กสำหรับวิดีโอคลิป ปรับปรุงคุณภาพของการค้นหา และการกำหนดเป้าหมายของโฆษณา
สถาปัตยกรรมระบบเพื่อระบุคุณลักษณะส่วนตัว
สถาปัตยกรรมระบบประกอบด้วย:
- เครื่องเซิร์ฟเวอร์
- นิติบุคคลร้านค้า
- เครื่องไคลเอนต์เชื่อมต่อกับเครือข่าย
เครือข่ายอาจเป็นเครือข่ายสาธารณะ (เช่นอินเทอร์เน็ต) เครือข่ายส่วนตัว (เช่นเครือข่ายท้องถิ่น (LAN) หรือเครือข่ายบริเวณกว้าง (WAN)) หรือรวมกัน
เครื่องไคลเอนต์อาจเป็นเทอร์มินัลไร้สาย (สมาร์ทโฟน ฯลฯ) คอมพิวเตอร์ส่วนบุคคล (PC) แล็ปท็อป คอมพิวเตอร์แท็บเล็ต หรือคอมพิวเตอร์หรืออุปกรณ์สื่อสารอื่น ๆ
เครื่องไคลเอนต์อาจใช้ระบบปฏิบัติการ (OS) ที่จัดการฮาร์ดแวร์และซอฟต์แวร์ของเครื่องไคลเอนต์
เบราว์เซอร์ (ไม่แสดง) อาจทำงานบนเครื่องไคลเอนต์ (เช่น บนระบบปฏิบัติการของเครื่องไคลเอนต์)
เบราว์เซอร์อาจเป็นเว็บเบราว์เซอร์ที่สามารถเข้าถึงหน้าเว็บและเนื้อหาที่เว็บเซิร์ฟเวอร์ให้บริการ
เครื่องไคลเอนต์อาจยังอัปโหลด:
- หน้าเว็บ
- คลิปสื่อ
- รายการบล็อก
- ลิงค์บทความ
- ต่อไป
เครื่องเซิร์ฟเวอร์ประกอบด้วยเว็บเซิร์ฟเวอร์และตัวจัดการแอตทริบิวต์ส่วนตัว เว็บเซิร์ฟเวอร์และตัวจัดการแอตทริบิวต์ทางอารมณ์อาจทำงานบนอุปกรณ์ต่างๆ
ร้านค้าเอนทิตีเป็นที่เก็บข้อมูลถาวรที่สามารถจัดเก็บเอนทิตี เช่น คลิปสื่อ (เช่น คลิปวิดีโอ คลิปเสียง คลิปที่มีทั้งวิดีโอและเสียง รูปภาพ ฯลฯ) และรายการเนื้อหาประเภทอื่นๆ (เช่น หน้าเว็บ ข้อความ เอกสารอ้างอิง รีวิวร้านอาหาร บทวิจารณ์ภาพยนตร์ ฯลฯ) ตลอดจนโครงสร้างข้อมูลเพื่อแท็ก จัดระเบียบ และจัดทำดัชนีเอนทิตี
ที่เก็บเอนทิตีอาจโฮสต์โดยอุปกรณ์จัดเก็บข้อมูล เช่น หน่วยความจำหลัก ดิสก์ที่ใช้การจัดเก็บข้อมูลแบบแม่เหล็กหรือแบบออปติคัล เทปหรือฮาร์ดไดรฟ์ NAS, SAN เป็นต้น
ร้านค้าเอนทิตีอาจโฮสต์โดยเซิร์ฟเวอร์ไฟล์ที่เชื่อมต่อกับเครือข่าย ในทางตรงกันข้าม ในการใช้งานอื่น ๆ ที่จัดเก็บเอนทิตีอาจได้รับการโฮสต์โดยหน่วยเก็บข้อมูลถาวรประเภทอื่น เช่น เครื่องเซิร์ฟเวอร์หรือเครื่องอื่นที่เชื่อมต่อกับเครื่องเซิร์ฟเวอร์ผ่านเครือข่าย
เอนทิตีที่จัดเก็บในร้านค้าเอนทิตีอาจรวมเนื้อหาที่ผู้ใช้สร้างขึ้นซึ่งได้รับการอัปโหลดโดยเครื่องไคลเอนต์และอาจรวมถึงเนื้อหาที่ผู้ให้บริการจัดหาให้ เช่น:
- องค์กรข่าว
- สำนักพิมพ์
- ห้องสมุด
- เร็วๆ นี้
เซิร์ฟเวอร์อาจให้บริการหน้าเว็บและเนื้อหาจากร้านค้าเอนทิตีให้กับลูกค้า
ตัวจัดการแอตทริบิวต์อัตนัย:
- ระบุแอตทริบิวต์อัตนัยสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ (เช่น ความคิดเห็น ชอบ! การแบ่งปัน บุ๊กมาร์ก เพลย์ลิสต์ ฯลฯ)
- กำหนดคะแนนความเกี่ยวข้องสำหรับคุณลักษณะส่วนตัวเกี่ยวกับเอนทิตี
- เชื่อมโยงคุณลักษณะอัตนัยและคะแนนความเกี่ยวข้องกับหน่วยงาน
- แยกคุณสมบัติต่างๆ เช่น คุณสมบัติของรูปภาพ เช่น สี พื้นผิว และความเข้ม คุณสมบัติด้านเสียง เช่น แอมพลิจูด อัตราส่วนสัมประสิทธิ์สเปกตรัม ลักษณะข้อความ เช่น ความถี่ของคำ ความยาวประโยคเฉลี่ย พารามิเตอร์การจัดรูปแบบ ข้อมูลเมตาที่เกี่ยวข้องกับเอนทิตี เป็นต้น) จากเอนทิตีเพื่อสร้างเวกเตอร์คุณลักษณะ
- ฝึกลักษณนามตามเวกเตอร์คุณลักษณะและคะแนนความเกี่ยวข้องของคุณลักษณะส่วนตัว
- ใช้ลักษณนามที่ผ่านการฝึกอบรมเพื่อทำนายคุณลักษณะส่วนตัวสำหรับเอนทิตีใหม่โดยพิจารณาจากเวกเตอร์คุณสมบัติของเอนทิตีใหม่
ผู้จัดการแอตทริบิวต์อัตนัย
ผู้จัดการแอตทริบิวต์อัตนัยอาจเหมือนกับผู้จัดการแอตทริบิวต์อัตนัยและอาจรวมถึง:
- ตัวระบุแอตทริบิวต์อัตนัย
- ผู้ทำคะแนนที่เกี่ยวข้อง
- ตัวแยกคุณสมบัติ
- ลักษณนาม
- ที่เก็บข้อมูล
.
ส่วนประกอบสามารถรวมกันหรือแยกออกเป็นรายละเอียดเพิ่มเติมได้
ที่เก็บข้อมูลอาจเหมือนกับที่เก็บเอนทิตีหรือที่เก็บข้อมูลอื่น (เช่น บัฟเฟอร์ชั่วคราวหรือที่เก็บข้อมูลถาวร) เพื่อเก็บคำศัพท์เกี่ยวกับแอตทริบิวต์ส่วนบุคคล เอนทิตีที่จะได้รับการประมวลผล เวกเตอร์คุณลักษณะที่เกี่ยวข้องกับเอนทิตี คุณลักษณะส่วนบุคคล และคะแนนความเกี่ยวข้องที่เกี่ยวข้องกับเอนทิตีหรือข้อมูลบางส่วนรวมกัน
Datastore อาจโฮสต์โดยอุปกรณ์จัดเก็บข้อมูล เช่น หน่วยความจำหลัก ดิสก์ที่ใช้หน่วยเก็บข้อมูลแบบแม่เหล็กหรือแบบออปติคัล เทปหรือฮาร์ดไดรฟ์ เป็นต้น
ตัวจัดการแอตทริบิวต์ตามอัตวิสัยจะแจ้งให้ผู้ใช้ทราบถึงประเภทของข้อมูลที่จัดเก็บไว้ในที่เก็บข้อมูลและที่จัดเก็บเอนทิตี และอนุญาตให้ผู้ใช้เลือกที่จะไม่ให้ข้อมูลดังกล่าวรวบรวมและแชร์กับผู้จัดการแอตทริบิวต์ส่วนตัว
ตัวระบุแอตทริบิวต์อัตนัย
ตัวระบุแอตทริบิวต์ส่วนบุคคลระบุแอตทริบิวต์ส่วนตัวสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ต่อเอนทิตี
ตัวระบุแอตทริบิวต์ส่วนบุคคลอาจระบุคุณลักษณะส่วนตัวผ่านการประมวลผลข้อความของความคิดเห็นของผู้ใช้ไปยังเอนทิตีที่โพสต์โดยผู้ใช้บนเว็บไซต์เครือข่ายสังคม
ตัวระบุแอตทริบิวต์อัตนัยอาจระบุแอตทริบิวต์อัตนัยสำหรับเอนทิตีตามปฏิกิริยาของผู้ใช้ประเภทอื่นๆ ต่อเอนทิตี เช่น:
- 'ชอบ!' หรือ 'ไม่ชอบ!'
- การแบ่งปันเอนทิตี
- บุ๊กมาร์กเอนทิตี
- การเพิ่มเอนทิตีลงในเพลย์ลิสต์
- ต่อไป
ตัวระบุแอตทริบิวต์ส่วนบุคคลอาจใช้เกณฑ์เพื่อกำหนดแอตทริบิวต์ที่เกี่ยวข้องกับเอนทิตี (เช่นแอตทริบิวต์ส่วนตัวควรปรากฏในความคิดเห็นอย่างน้อย N เป็นต้น)
ผู้ให้คะแนนความเกี่ยวข้องจะกำหนดคะแนนความเกี่ยวข้องสำหรับคุณลักษณะส่วนตัวเกี่ยวกับเอนทิตี
ตัวอย่างเช่น เมื่อตัวระบุแอตทริบิวต์อัตนัยได้ระบุแอตทริบิวต์อัตนัย "น่ารัก" "ตลก" และ "ยอดเยี่ยม" ตามความคิดเห็นในคลิปสื่อที่โพสต์บนเว็บไซต์เครือข่ายสังคมออนไลน์ ผู้ให้คะแนนความเกี่ยวข้องอาจกำหนดคะแนนความเกี่ยวข้องสำหรับแต่ละอัตนัยทั้งสามนี้ คุณสมบัติขึ้นอยู่กับ:
- ความถี่ที่คุณลักษณะส่วนตัวเหล่านี้ปรากฏในความคิดเห็น
- ผู้ใช้เฉพาะที่ให้คุณลักษณะส่วนตัว
- ต่อไป
ตัวอย่างเช่น หากมี 40 ความคิดเห็นและ "น่ารัก" ปรากฏใน 20 คำ และ "เจ๋ง" ปรากฏใน 8 ความคิดเห็น "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องที่สูงกว่า "ยอดเยี่ยม"
คะแนนความเกี่ยวข้องอาจถูกกำหนดตามสัดส่วนของความคิดเห็นที่แอตทริบิวต์อัตนัยปรากฏ (เช่นคะแนน 0.5 สำหรับ "น่ารัก" และคะแนน 0.2 สำหรับ "ยอดเยี่ยม" เป็นต้น)
ผู้ให้คะแนนความเกี่ยวข้องอาจเก็บเฉพาะคุณลักษณะอัตนัยที่เกี่ยวข้องมากที่สุด k และละทิ้งคุณลักษณะส่วนบุคคลอื่นๆ
ตัวอย่างเช่น สมมติว่าตัวระบุแอตทริบิวต์ส่วนบุคคลระบุคุณลักษณะทางอารมณ์เจ็ดประการที่ปรากฏในความคิดเห็นของผู้ใช้อย่างน้อยสามครั้ง ในกรณีนั้น ตัวอย่างเช่น ผู้ให้คะแนนความเกี่ยวข้องอาจคงไว้เพียงคุณลักษณะเชิงอัตวิสัยห้าประการที่มีคะแนนความเกี่ยวข้องสูงสุด และละทิ้งคุณลักษณะทางอารมณ์อีกสองอย่าง (เช่น โดยการตั้งค่าคะแนนความเกี่ยวข้องเป็นศูนย์ เป็นต้น)
คะแนนความเกี่ยวข้องเป็นตัวเลขปกติระหว่าง 0.0 ถึง 1.0
ตัวแยกคุณลักษณะได้รับเวกเตอร์คุณลักษณะสำหรับเอนทิตีโดยใช้เทคนิคต่างๆ เช่น:
- การวิเคราะห์องค์ประกอบหลัก
- การฝังแบบกึ่งกำหนด
- ไอโซแมปส์
- สี่เหลี่ยมจัตุรัสน้อยที่สุด
- ต่อไป
การคำนวณที่เกี่ยวข้องกับการแยกคุณลักษณะของเอนทิตีนั้นดำเนินการโดยตัวแยกคุณลักษณะเอง
ในด้านอื่น ๆ การคำนวณเหล่านี้ดำเนินการโดยเอนทิตีอื่น เช่น ไลบรารีที่ปฏิบัติการได้ของ:
- รูทีนการประมวลผลภาพที่โฮสต์โดยเครื่องเซิร์ฟเวอร์ [ไม่ปรากฎในรูป]
- ขั้นตอนการประมวลผลเสียง
- ขั้นตอนการประมวลผลข้อความ
- ฯลฯ
ผลลัพธ์จะถูกส่งไปยังตัวแยกคุณลักษณะ
ตัวแยกประเภทเป็นเครื่องเรียนรู้ (เช่น เครื่องเวกเตอร์สนับสนุน [SVM], AdaBoost, เครือข่ายประสาทเทียม, แผนผังการตัดสินใจ เป็นต้น) ที่ยอมรับเวกเตอร์คุณลักษณะที่เกี่ยวข้องกับเอนทิตีและส่งออกคะแนนความเกี่ยวข้อง (เช่น จำนวนจริงระหว่าง 0 และรวม 1 รายการ เป็นต้น) สำหรับแต่ละคุณลักษณะส่วนตัวของคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล
ลักษณนามประกอบด้วยตัวแยกประเภทเดียว
ตัวแยกประเภทอาจรวมถึงตัวแยกประเภทหลายตัว (เช่น ตัวแยกประเภทสำหรับคุณลักษณะเชิงอัตนัยแต่ละตัวในคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล ฯลฯ)
ชุดของตัวอย่างเชิงบวกและเกณฑ์เชิงลบจะถูกรวบรวมสำหรับแต่ละคุณลักษณะส่วนตัวในคำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคล
ชุดตัวอย่างเชิงบวกสำหรับแอตทริบิวต์อัตนัยอาจรวมถึงเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่เกี่ยวข้องกับคุณลักษณะส่วนบุคคลนั้น
ชุดตัวอย่างเชิงลบสำหรับแอตทริบิวต์อัตนัยอาจรวมถึงเวกเตอร์คุณลักษณะสำหรับเอนทิตีที่ไม่เกี่ยวข้องกับแอตทริบิวต์ส่วนบุคคลนั้น
เมื่อชุดของตัวอย่างเชิงบวกและชุดของเกณฑ์เชิงลบมีขนาดไม่เท่ากัน ชุดที่กว้างกว่าอาจได้รับตัวอย่างเพื่อให้ตรงกับขนาดของกลุ่มที่เล็กกว่า
หลังการฝึกอบรม ตัวแยกประเภทอาจคาดการณ์คุณลักษณะส่วนตัวสำหรับเอนทิตีอื่นๆ ที่ไม่ได้อยู่ในชุดการฝึกโดยจัดเตรียมเวกเตอร์คุณลักษณะสำหรับเอนทิตีเหล่านี้เป็นอินพุตไปยังตัวแยกประเภท
ชุดของคุณลักษณะเชิงอัตวิสัยอาจได้มาจากผลลัพธ์ของตัวแยกประเภทโดยรวมคุณลักษณะทางอารมณ์ทั้งหมดที่มีคะแนนความเกี่ยวข้องที่ไม่เป็นศูนย์ กลุ่มของคะแนนอัตนัยอาจได้มาจากการใช้เกณฑ์ขั้นต่ำสุดกับคะแนนที่เป็นตัวเลข (โดยพิจารณาจากคุณลักษณะส่วนบุคคลทั้งหมดที่มีคะแนนอย่างน้อย พูด 0.2 เป็นสมาชิกของชุด)
การระบุคุณลักษณะส่วนตัวของนิติบุคคล
วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ (เช่น รันบนระบบคอมพิวเตอร์เอนกประสงค์หรือเครื่องเฉพาะ) หรือทั้งสองอย่าง
วิธีการดำเนินการโดยเครื่องเซิร์ฟเวอร์ในขณะที่การใช้งานอื่น ๆ บางอย่างอาจดำเนินการโดยอุปกรณ์อื่น
ส่วนประกอบต่างๆ ของตัวจัดการแอตทริบิวต์ตามอัตวิสัยอาจทำงานบนเครื่องแยกกัน (เช่น ตัวระบุแอตทริบิวต์ส่วนบุคคลและผู้ให้คะแนนความเกี่ยวข้องอาจทำงานบนอุปกรณ์เครื่องหนึ่งในขณะที่ตัวแยกคุณลักษณะและตัวแยกประเภททำงานบนอุปกรณ์อื่น เป็นต้น)
เพื่อความง่ายในการอธิบาย วิธีนี้จะอธิบายและอธิบายเป็นชุดของการกระทำ
แต่การกระทำสามารถเกิดขึ้นได้ในลำดับต่างๆ และกับการกระทำอื่นๆ ที่ไม่ได้นำเสนอและอธิบายไว้ในที่นี้
นอกจากนี้ การกระทำที่มีภาพประกอบอาจไม่จำเป็นต้องติดตั้งวิธีการตามหัวข้อที่เปิดเผยทั้งหมด
นอกจากนี้ ผู้มีทักษะในศิลปวิทยาการแขนงนี้เข้าใจและชื่นชมว่าวิธีการสามารถแสดงเป็นชุดของสถานะที่สัมพันธ์กันผ่านทางไดอะแกรมสถานะหรือเหตุการณ์
นอกจากนี้ ควรได้รับการชื่นชมว่าวิธีการที่เปิดเผยในข้อกำหนดนี้มีความสามารถในการจัดเก็บในบทความของการผลิต เพื่อความสะดวกในการขนส่งและถ่ายโอนวิธีการดังกล่าวไปยังอุปกรณ์คอมพิวเตอร์
คำว่า บทความของการผลิต ตามที่ใช้ในที่นี้ มีจุดมุ่งหมายเพื่อหมายรวมถึงโปรแกรมคอมพิวเตอร์ที่สามารถเข้าถึงได้จากอุปกรณ์ที่คอมพิวเตอร์อ่านได้หรือสื่อบันทึกข้อมูล
คำศัพท์ของคุณลักษณะอัตนัยถูกสร้างขึ้น
ในบางแง่มุม อาจมีการกำหนดคำศัพท์แอตทริบิวต์อัตนัย ในทางตรงกันข้าม ในบางปัจจัย คำศัพท์เกี่ยวกับคุณลักษณะส่วนบุคคลอาจสร้างขึ้นโดยอัตโนมัติโดยการรวบรวมคำศัพท์และวลีที่ใช้ในการโต้ตอบของผู้ใช้ต่อเอนทิตี ในทางตรงกันข้าม ในด้านอื่น ๆ คำศัพท์อาจเกิดจากการผสมผสานระหว่างเทคนิคแบบแมนนวลและแบบอัตโนมัติ
คำศัพท์ได้รับการเพาะด้วยคุณลักษณะส่วนตัวจำนวนเล็กน้อยที่คาดว่าจะนำไปใช้กับเอนทิตี คำศัพท์จะขยายเพิ่มขึ้นเมื่อเวลาผ่านไป เนื่องจากมีการระบุคำศัพท์หรือวลีที่ปรากฏในปฏิกิริยาของผู้ใช้ผ่านการประมวลผลคำตอบโดยอัตโนมัติ
คำศัพท์เกี่ยวกับคุณลักษณะส่วนตัวอาจจัดเป็นลำดับชั้น อาจขึ้นอยู่กับ "คุณลักษณะเมตา" ที่เกี่ยวข้องกับคุณลักษณะส่วนบุคคล (เช่น คุณลักษณะส่วนบุคคล "ตลก" อาจมีแอตทริบิวต์เมตาเป็น "แง่บวก" ในขณะที่ประเด็นส่วนตัว "น่าขยะแขยง" อาจมี meta-attribute “เชิงลบ” เป็นต้น)
ชุด S ของเอนทิตี (เช่น เอนทิตีทั้งหมดในร้านค้าเอนทิตี เซ็ตย่อยของเอนทิตีในร้านค้าเอนทิตี ฯลฯ) จะได้รับการประมวลผลล่วงหน้า
ภายใต้แง่มุมหนึ่ง การประมวลผลล่วงหน้าของเอนทิตีประกอบด้วยการระบุปฏิกิริยาของผู้ใช้ต่อเอนทิตี จากนั้นจึงฝึกอบรมตัวแยกประเภทตามการตอบสนอง
เมื่อนิติบุคคลเป็นนิติบุคคลจริง
ควรสังเกตว่าเมื่อเอนทิตีเป็นตัวตนจริง (เช่น บุคคล ร้านอาหาร ฯลฯ) การประมวลผลล่วงหน้าของเอนทิตีนั้นจะดำเนินการผ่าน "พร็อกซีทางไซเบอร์" ที่เกี่ยวข้องกับเอนทิตีทางกายภาพ (เช่น แฟนเพจสำหรับนักแสดงบนเว็บไซต์โซเชียลเน็ตเวิร์ก รีวิวร้านอาหารบนเว็บไซต์ ฯลฯ); แต่แอตทริบิวต์อัตนัยจะถือว่ามีความเกี่ยวข้องกับตัวตน (เช่น นักแสดงหรือร้านอาหาร ไม่ใช่แฟนเพจของนักแสดงหรือรีวิวร้านอาหาร)
ตัวอย่างวิธีการดำเนินการอธิบายโดยละเอียด
รับเอนทิตี E ที่ไม่ได้อยู่ในชุด S (เช่น คลิปวิดีโอที่อัปโหลดใหม่ บทความข่าวที่ยังไม่ได้รับความคิดเห็น เอนทิตีในร้านค้าเอนทิตีที่ไม่รวมอยู่ในชุดการฝึก ฯลฯ)
แอตทริบิวต์หัวเรื่องและคะแนนความเกี่ยวข้องสำหรับเอนทิตี E ได้รับแล้ว
มีการอธิบายการใช้งานวิธีตัวอย่างแรกโดยละเอียดด้านล่าง และอธิบายประสิทธิภาพของวิธีตัวอย่างที่สอง
คุณลักษณะเชิงอัตนัยและคะแนนความเกี่ยวข้องที่ได้รับจะสัมพันธ์กับเอนทิตี E (เช่น โดยการใช้แท็กที่สอดคล้องกับเอนทิตี การเพิ่มเรกคอร์ดในตารางฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)
การดำเนินการยังคงดำเนินต่อไป
ควรสังเกตว่าตัวแยกประเภทอาจได้รับการฝึกอบรมใหม่ (เช่น หลังจากการวนซ้ำทุกๆ 100 ครั้ง ทุกๆ N วัน เป็นต้น) โดยกระบวนการฝึกอบรมใหม่ที่อาจดำเนินการพร้อมกัน
การประมวลผลชุดเอนทิตีล่วงหน้า
วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ (เช่น รันบนระบบคอมพิวเตอร์เอนกประสงค์หรือเครื่องเฉพาะ) หรือทั้งสองอย่าง
วิธีการนี้ได้รับการดำเนินการ ในขณะที่การใช้งานอื่นๆ อาจดำเนินการโดยเครื่องอื่น
ชุดการฝึกจะเริ่มต้นเป็นชุดว่าง เอนทิตี E ได้รับเลือกและลบออกจากชุด S ของเอนทิตี
คุณลักษณะเฉพาะบุคคลสำหรับเอนทิตี E ถูกระบุตามปฏิกิริยาของผู้ใช้ต่อเอนทิตี E (เช่น ความคิดเห็นของผู้ใช้ ชอบ! บุ๊กมาร์ก การแชร์ การเพิ่มลงในเพลย์ลิสต์ ฯลฯ)
การระบุแอตทริบิวต์อัตนัยรวมถึงการประมวลผลความคิดเห็นของผู้ใช้ เช่น โดย:
- การจับคู่คำในความคิดเห็นของผู้ใช้กับคุณลักษณะส่วนตัวในคำศัพท์
- รวมการจับคู่คำและเทคนิคการประมวลผลภาษาธรรมชาติอื่นๆ เช่น การวิเคราะห์วากยสัมพันธ์และความหมาย
- ฯลฯ
หน่วยงานที่เกิดขึ้นใกล้สถานที่
ปฏิกิริยาของผู้ใช้อาจได้รับการรวมสำหรับเอนทิตีที่เกิดขึ้นในหลายสถานที่ เช่น:
- เอนทิตีที่ปรากฏในเพลย์ลิสต์ของผู้ใช้จำนวนมาก
- หน่วยงานที่ได้รับการแบ่งปันและปรากฏใน "ฟีดข่าว" ของผู้ใช้จำนวนมากบนเว็บไซต์เครือข่ายสังคม
- ฯลฯ
สถานที่ต่างๆ อาจได้รับการถ่วงน้ำหนักในการมีส่วนร่วมกับคะแนนความเกี่ยวข้อง โดยพิจารณาจากปัจจัยหลายประการ เช่น
ผู้ใช้รายใดรายหนึ่งที่เกี่ยวข้องกับสถานที่นั้น (เช่น ผู้ใช้เฉพาะรายอาจเป็นผู้มีอำนาจในดนตรีคลาสสิก ดังนั้นความคิดเห็นเกี่ยวกับเอนทิตีในฟีดข่าวของพวกเขาอาจได้รับน้ำหนักมากกว่าความคิดเห็นในฟีดข่าวอื่น ฯลฯ ) ปฏิกิริยาของผู้ใช้ที่ไม่ใช่ข้อความ (เช่น เช่น “ชอบ!”, “ไม่ชอบ!”, “+1” เป็นต้น)
นอกจากนี้ จำนวนสถานที่ที่เอนทิตีปรากฏขึ้นอาจใช้ในการกำหนดคุณลักษณะส่วนตัวและคะแนนความเกี่ยวข้อง (เช่น คะแนนความเกี่ยวข้องสำหรับคลิปวิดีโออาจเพิ่มขึ้นเมื่อคลิปวิดีโออยู่ในเพลย์ลิสต์ของผู้ใช้หลายร้อยรายการ เป็นต้น)
บล็อกดำเนินการโดยตัวระบุแอตทริบิวต์อัตนัย
คะแนนความเกี่ยวข้องสำหรับแอตทริบิวต์อัตนัยกำหนดโดยเอนทิตี E
คะแนนความเกี่ยวข้องจะถูกกำหนดสำหรับคุณลักษณะส่วนตัวโดยพิจารณาจากความถี่ที่คุณลักษณะส่วนบุคคลปรากฏในความคิดเห็นของผู้ใช้ ผู้ใช้ที่ระบุรายละเอียดส่วนตัวในคำพูดของพวกเขา (เช่น ผู้ใช้บางรายอาจทราบจากประสบการณ์ว่ามีความแม่นยำมากขึ้นใน ความคิดเห็นของพวกเขามากกว่าผู้ใช้รายอื่น ฯลฯ )
ตัวอย่างเช่น หากมี 40 ความคิดเห็นและ "น่ารัก" ปรากฏใน 20 คำ และ "เจ๋ง" ปรากฏใน 8 ความคิดเห็น "น่ารัก" อาจได้รับคะแนนความเกี่ยวข้องที่สูงกว่า "ยอดเยี่ยม"
คะแนนความเกี่ยวข้องอาจถูกกำหนดตามสัดส่วนของความคิดเห็นที่มีคุณลักษณะส่วนตัวปรากฏ (เช่น คะแนน 0.5 สำหรับ "น่ารัก" และคะแนน 0.2 สำหรับ "ยอดเยี่ยม" เป็นต้น)
ภายใต้แง่มุมหนึ่ง คะแนนความเกี่ยวข้องจะถูกทำให้เป็นมาตรฐานเพื่อให้อยู่ในช่วง [0, 1]
ในบางแง่มุม คุณลักษณะส่วนตัวที่ระบุอาจถูกละทิ้งตามคะแนนความเกี่ยวข้อง (เช่น การรักษาคุณลักษณะทางอารมณ์ k ที่มีคะแนนความเกี่ยวข้องสูงสุด ละทิ้งคุณลักษณะส่วนบุคคลที่มีคะแนนความเกี่ยวข้องต่ำกว่าเกณฑ์ ฯลฯ)
ควรสังเกตว่าแอตทริบิวต์อัตนัยอาจถูกละทิ้งโดยการตั้งค่าคะแนนความเกี่ยวข้องเป็นศูนย์ในบางแง่มุม
คุณสมบัติอัตนัยและคะแนนความเกี่ยวข้องสัมพันธ์กับเอนทิตี
คุณลักษณะอัตนัยและคะแนนความเกี่ยวข้องสัมพันธ์กับเอนทิตี (เช่น ผ่านการแท็ก รายการในตารางในฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)
ได้รับเวกเตอร์คุณลักษณะสำหรับเอนทิตี E
ในด้านหนึ่ง เวกเตอร์คุณลักษณะสำหรับคลิปวิดีโอหรือภาพนิ่งอาจมีค่าตัวเลขเกี่ยวกับสี พื้นผิว ความเข้ม ฯลฯ ในขณะที่เวกเตอร์คุณลักษณะสำหรับคลิปเสียง (หรือวิดีโอคลิปพร้อมเสียง) อาจรวมค่าตัวเลขเกี่ยวกับแอมพลิจูด , สัมประสิทธิ์สเปกตรัม ฯลฯ ในขณะที่เวกเตอร์คุณลักษณะสำหรับเอกสารข้อความอาจรวมถึง:
- ค่าตัวเลขเกี่ยวกับความถี่ของคำ
- ความยาวประโยคเฉลี่ย
- พารามิเตอร์การจัดรูปแบบ
- ต่อไป
นี้อาจดำเนินการโดยตัวแยกคุณลักษณะ
เพิ่มคุณสมบัติเวกเตอร์และคะแนนความเกี่ยวข้องที่ได้รับลงในชุดการฝึก
bock ตรวจสอบว่าชุด S ของเอนทิตีว่างเปล่าหรือไม่ ถ้า S ไม่ว่าง การดำเนินการจะดำเนินต่อไป มิฉะนั้น การดำเนินการจะดำเนินการ
ตัวแยกประเภทได้รับการฝึกอบรมจากตัวอย่างทั้งหมดของชุดการฝึก เช่น เวกเตอร์คุณลักษณะของตัวอย่างการฝึกจะได้รับเป็นข้อมูลป้อนเข้าไปยังตัวแยกประเภท และคะแนนความเกี่ยวข้องของแอตทริบิวต์แบบอัตนัยจะได้รับให้เป็นผลลัพธ์
การรับคุณสมบัติอัตนัยและคะแนนความเกี่ยวข้องสำหรับนิติบุคคล
มีการสร้างเวกเตอร์คุณลักษณะสำหรับเอนทิตี E
ตามที่อธิบายไว้ข้างต้น เวกเตอร์คุณลักษณะสำหรับคลิปวิดีโอหรือภาพนิ่งอาจมีค่าตัวเลขเกี่ยวกับสี พื้นผิว ความเข้ม ฯลฯ ในทางตรงกันข้าม เวกเตอร์คุณลักษณะสำหรับคลิปเสียง (หรือวิดีโอคลิปพร้อมเสียง) อาจมีค่าตัวเลข เกี่ยวกับแอมพลิจูด สัมประสิทธิ์สเปกตรัม ฯลฯ ในทางตรงกันข้าม เวกเตอร์คุณลักษณะสำหรับเอกสารข้อความอาจรวมค่าตัวเลขเกี่ยวกับความถี่ของคำ ความยาวประโยคเฉลี่ย พารามิเตอร์การจัดรูปแบบ และอื่นๆ
ตัวแยกประเภทที่ผ่านการฝึกอบรมจัดเตรียมเวกเตอร์คุณลักษณะเพื่อรับคุณลักษณะส่วนตัวที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องสำหรับเอนทิตี E
คุณลักษณะเชิงอัตนัยที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องจะเชื่อมโยงกับเอนทิตี E (เช่น ผ่านแท็กที่ใช้กับเอนทิตี E ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)
วิธีที่สองในการรับคุณสมบัติส่วนตัวและคะแนนที่เกี่ยวข้องสำหรับนิติบุคคล
วิธีการดำเนินการโดยใช้ตรรกะการประมวลผลที่อาจประกอบด้วยฮาร์ดแวร์ (วงจร ลอจิกเฉพาะ ฯลฯ) ซอฟต์แวร์ หรือทั้งสองอย่างรวมกัน
วิธีการนี้ดำเนินการโดยเครื่องเซิร์ฟเวอร์ ในขณะที่วิธีอื่นๆ อาจดำเนินการโดยอุปกรณ์อื่น
มีการสร้างเวกเตอร์คุณลักษณะสำหรับเอนทิตี E ตัวแยกประเภทที่ผ่านการฝึกอบรมจัดเตรียมเวกเตอร์คุณลักษณะเพื่อรับคุณลักษณะส่วนตัวที่คาดการณ์ไว้และคะแนนความเกี่ยวข้องสำหรับเอนทิตี E
แอตทริบิวต์ส่วนตัวที่คาดการณ์ไว้ได้รับการแนะนำแก่ผู้ใช้ (เช่น ผู้ใช้ที่อัปโหลดเอนทิตี ชุดแอตทริบิวต์ส่วนบุคคลที่ได้รับการปรับปรุงจะได้รับจากผู้ใช้ เช่น ผ่านหน้าเว็บที่ผู้ใช้เลือกจากแอตทริบิวต์ที่แนะนำและอาจเป็นไปได้ เพิ่มคุณสมบัติใหม่ ฯลฯ )
คะแนนความเกี่ยวข้องเริ่มต้นสำหรับเอนทิตี
คะแนนความเกี่ยวข้องเริ่มต้นถูกกำหนดให้กับแอตทริบิวต์อัตนัยใหม่ที่เพิ่มโดยผู้ใช้
คะแนนความเกี่ยวข้องเริ่มต้นอาจเป็น 1.0 ในระดับตั้งแต่ 0.0 ถึง 1.0 คะแนนความเกี่ยวข้องเริ่มต้นอาจขึ้นอยู่กับผู้ใช้รายใดรายหนึ่ง (เช่นคะแนน 1.0 เมื่อผู้ใช้ทราบจากประวัติที่ผ่านมาว่าสามารถแนะนำคุณลักษณะได้ดีมาก คะแนน 0.8 เมื่อทราบว่าผู้ใช้ค่อนข้างดีในการแนะนำคุณลักษณะ ฯลฯ)
สาขาที่ถูกบล็อกขึ้นอยู่กับว่าผู้ใช้ลบแอตทริบิวต์อัตนัยที่แนะนำหรือไม่ (เช่นโดยไม่เลือกแอตทริบิวต์)
เอนทิตี E ถูกจัดเก็บเป็นตัวอย่างเชิงลบของแอททริบิวต์ที่ถูกลบออกสำหรับการฝึกซ้ำในอนาคตของตัวแยกประเภท ชุดแอตทริบิวต์ส่วนตัวที่ปรับปรุงแล้วและคะแนนความเกี่ยวข้องที่เกี่ยวข้องจะเชื่อมโยงกับเอนทิตี E (เช่น ผ่านแท็กที่ใช้กับเอนทิตี E ผ่านรายการในตารางของฐานข้อมูลเชิงสัมพันธ์ ฯลฯ)