วิธีเลือกไม่ใช้บอทฝึกอบรม AI โดย Google Bard และ OpenAI ChatGPT

เผยแพร่แล้ว: 2023-11-13

เนื่องจากปัญญาประดิษฐ์เพิ่งเริ่มทำให้ชีวิตอินเทอร์เน็ต (และปกติ) แย่ลง หลายคนตั้งคำถามด้านจริยธรรมเกี่ยวกับวิธีที่บริษัทที่พัฒนา AI แหล่งที่มาของข้อมูลที่ใช้สำหรับการฝึกอบรมซอฟต์แวร์นี้ เพื่อแก้ไขข้อกังวลเหล่านี้ ทั้ง OpenAI และ Google ได้ดำเนินการเพื่อให้ผู้เผยแพร่มีตัวเลือกในการยกเว้นเนื้อหาของตนจากการถูกใช้เพื่อฝึกบอท AI

ผู้เผยแพร่เว็บกังวลเกี่ยวกับ AI Bots

ผู้เผยแพร่มีสิทธิ์ที่จะกังวลเกี่ยวกับบทบาทที่เนื้อหาของตนมีในการฝึกอบรม AI และพวกเขาอาจกังวลด้วยเหตุผลหลายประการที่แตกต่างกัน

ลิขสิทธิ์เนื้อหาและรายได้

ผู้สร้างและผู้เผยแพร่มีสิทธิ์สร้างรายได้จากเนื้อหาที่พวกเขาเผยแพร่ ใครก็ตามที่มีลิขสิทธิ์ควรได้รับประโยชน์จากการใช้เนื้อหาของตน สิ่งนี้ทำให้เกิดข้อกังวลสองประการสำหรับผู้เผยแพร่โฆษณา

ประการแรก บริษัทที่พัฒนาโปรแกรมปัญญาประดิษฐ์กำลังใช้เนื้อหาของผู้จัดพิมพ์โดยไม่ต้องจ่ายค่าตอบแทน แม้ว่านี่จะเป็นการใช้งานที่ไม่ธรรมดามาก่อน แต่โปรแกรมการฝึกอบรมก็เป็นวิธีที่สามารถใช้เนื้อหาได้ ดังนั้น ผู้จัดพิมพ์จึงควรควบคุมได้ว่าจะอนุญาตหรือไม่ (และอาจเรียกเก็บเงินหรือไม่)

"คัดลอกและประมวลผลภาพนับล้านภาพที่ได้รับการคุ้มครองโดยลิขสิทธิ์อย่างผิดกฎหมาย"
- คดีความของเก็ตตี้อิมเมจ

นี่คือสิ่งที่ Getty Images ซึ่งเป็นหนึ่งในผู้ให้บริการรูปภาพและวิดีโอออนไลน์รายใหญ่ที่สุดเรียกเก็บเงินจาก OpenAI Getty Images อ้างว่าภาพ 12 ล้านภาพของพวกเขาถูกใช้ “โดยไม่ได้รับอนุญาต…หรือไม่มีการชดเชย” คดีดังกล่าวประกอบด้วยตัวอย่างภาพหลายภาพที่มีลายน้ำ Getty Images ที่เบลอ

คดีเพิ่มเติมโดย Getty Images อ้างว่า Stability AI "คัดลอกและประมวลผลภาพหลายล้านภาพที่ได้รับการคุ้มครองโดยลิขสิทธิ์อย่างผิดกฎหมาย" พร้อมตัวอย่างไฟล์ที่สร้างด้วยโลโก้ Getty ที่ดัดแปลงโดย AI

Getty Images ต่อสู้กับการละเมิดลิขสิทธิ์ต่อความเสถียรของ AI - BeyondGames.biz

การเปรียบเทียบภาพถ่ายบน The Verge

การเปลี่ยนแปลงในอุตสาหกรรมผู้จัดพิมพ์นำมาโดย AI

ผู้เผยแพร่โฆษณาบางรายอาจมองว่า AI เป็นภัยคุกคามในอุตสาหกรรมของตน แม้ว่าพวกเขาจะยอมรับว่าในที่สุดรูปแบบธุรกิจจะต้องเปลี่ยนแปลงเนื่องจากความสามารถของ AI แต่พวกเขาอาจไม่ต้องการเร่งการพัฒนาซอฟต์แวร์

แม้ว่าการป้องกันไม่ให้บริษัท AI เข้าถึงผู้จัดพิมพ์รายใดรายหนึ่งอาจส่งผลกระทบเล็กน้อยต่อการพัฒนา ผู้จัดพิมพ์บางรายอาจคัดค้านสิ่งนี้ตามหลักการ

การปกป้องเนื้อหาที่ไม่ซ้ำใคร

ผู้เผยแพร่โฆษณาบางรายอาจหวังที่จะรักษาเนื้อหาของตนให้มีเอกลักษณ์เฉพาะตัวโดยป้องกันไม่ให้ AI คัดลอกเนื้อหาดังกล่าว (หรือทำสิ่งที่คล้ายกัน) นี่ไม่ใช่ความท้าทายใหม่สำหรับผู้เผยแพร่โฆษณาออนไลน์ เนื่องจากมีการใช้โปรแกรมขูดเพื่อรวบรวมข้อมูลจากเว็บไซต์มานานแล้ว อย่างไรก็ตาม เป็นอีกแง่มุมหนึ่งที่อาจเกี่ยวข้องกับกลุ่มเฉพาะทางหรือแพลตฟอร์มข่าว

ตัวเลือกในการยกเลิกการฝึกอบรม AI

หากไม่มีข้อบังคับ ผู้เผยแพร่โฆษณาจะต้องเลือกไม่รับการพัฒนาของบริษัท AI แต่ละแห่งด้วยตนเอง สองรายการหลักที่ต้องเลือกไม่ใช้คือ OpenAI (ผู้สร้าง ChatGPT) และ Google (ซึ่งมี Bard และ Vertex AI)

ในอุตสาหกรรมสิ่งพิมพ์ออนไลน์บางคนมองว่านี่เป็นทางเลือกเล็กน้อย โดยผู้บริหารคนหนึ่งกล่าวว่า "มันเป็นการแสดงสัญลักษณ์...ฉันคิดว่ามันเป็นความพยายามที่สูญเปล่าในส่วนของฉัน เป็นสิ่งที่หลีกเลี่ยงไม่ได้ที่สิ่งนี้จะถูกกลืนเข้าไป คลาน และเรียนรู้จากมัน”

อย่างไรก็ตาม ขณะนี้ผู้จัดพิมพ์มีตัวเลือกในการยกเลิกได้

วิธียกเลิกการใช้งาน ChatGPT

เว็บไซต์บางแห่งไม่ต้องกังวลว่าโปรแกรมรวบรวมข้อมูลของ OpenAI จะรวบรวมข้อมูลจากเนื้อหาของตน

บริษัทกล่าวว่าจะไม่รวบรวมข้อมูลจากเนื้อหาที่อยู่หลังเพย์วอลล์หรือแบบฟอร์มที่ขอข้อมูลส่วนบุคคล นอกจากนี้ยังไม่รวบรวมข้อมูลไซต์ที่ไม่สอดคล้องกับแนวทางเนื้อหาของ OpenAI ทั้งหมดนี้จะถูกกรองออกโดยอัตโนมัติ

ผู้จัดพิมพ์ที่มีเนื้อหาที่ไม่ถูกจำกัดโดยอัตโนมัติ (ซึ่งรวมถึงผู้จัดพิมพ์ส่วนใหญ่) สามารถบล็อก GPTBot ได้โดยการเพิ่มโค้ดพื้นฐานลงในไฟล์ robots.txt ของเว็บไซต์ของตน

GPTBot ถูกระบุภายในไฟล์ robots.txt ดังนี้

โทเค็นตัวแทนผู้ใช้: GPTBot
สตริงตัวแทนผู้ใช้แบบเต็ม: Mozilla/5.0 AppleWebKit/537.36
(KHTML เช่น Gecko; เข้ากันได้; GPTBot/1.0;
+https://openai.com/gptbot)

หากต้องการบล็อก GPTBot โดยสิ้นเชิง ให้เพิ่มสิ่งต่อไปนี้ลงในไฟล์ robots.txt ของเว็บไซต์ของคุณ:

ตัวแทนผู้ใช้: GPTBot
ไม่อนุญาต: /

หากต้องการบล็อก GPTBot จากเนื้อหาที่เฉพาะเจาะจง ให้ใช้ตัวอย่างต่อไปนี้เพื่อเลือกโฟลเดอร์ที่สามารถเข้าถึงได้และไม่สามารถเข้าถึงได้:

ตัวแทนผู้ใช้: GPTBot
อนุญาต: /directory-1/
ไม่อนุญาต: /directory-2/

ซึ่งคล้ายกับการบล็อก Google หรือโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาอื่นไม่ให้เข้าถึงเว็บไซต์หรือโฟลเดอร์

วิธียกเลิก Google Bard

Google เปิดให้ใช้งาน Bard AI และ Vertex AI ในเดือนกันยายน 2023 การเลือกไม่ใช้จะดำเนินการในลักษณะเดียวกับการเลือกไม่ใช้ของ OpenAI

หากต้องการบล็อกโปรแกรมรวบรวมข้อมูล AI ของ Google ให้เพิ่มโค้ดต่อไปนี้ลงในไฟล์ robots.txt ของเว็บไซต์ของคุณ:

User-agent: Google-ขยาย
ไม่อนุญาต: /

เช่นเดียวกับบอตของ OpenAI คุณสามารถให้สิทธิ์การเข้าถึงแก่ Google บางส่วนแต่ไม่ทั้งหมด:

User-agent: Google-ขยาย
อนุญาต: /directory-1/
ไม่อนุญาต: /directory-2/

"พวกเขาถือว่าทั้งหมดเป็นผลิตภัณฑ์การค้นหาที่สำคัญรายการเดียว"
- แมตต์ โรเจอร์สัน จาก The Guardian

ก่อนที่จะเลือกไม่ใช้ เว็บมาสเตอร์และผู้เผยแพร่ควรทราบว่านี่อาจหมายความว่าไซต์จะไม่ถูกรวบรวมข้อมูลสำหรับการจัดทำดัชนีการค้นหาเช่นกัน ดังที่ Matt Rogerson จาก The Guardian กล่าวไว้ สิ่งเหล่านี้คือ "เครื่องขูดที่มัดรวมกัน" เขาอธิบายว่า: “พวกเขาปฏิบัติต่อมันทั้งหมดเป็นผลิตภัณฑ์การค้นหาขนาดใหญ่ชิ้นเดียว พวกเขาแบบว่า 'ไม่ คุณไม่ได้รับตัวเลือกแบบละเอียด' เราให้โอกาสคุณในการยกเลิก แต่เห็นได้ชัดว่าเราไม่ต้องการยกเลิกการรวบรวมข้อมูลเว็บทั้งหมด”

บล็อกบอทฝึกอบรม AI จากเนื้อหาของคุณ

โซลูชันนี้ไม่สมบูรณ์แบบ จนถึงขณะนี้มีเพียงนักพัฒนา AI สองคนเท่านั้น (เช่น ไม่ใช่ Microsoft) และบริษัททั้งหมดในสาขานี้ได้คัดลอกข้อมูลจำนวนมหาศาลไปแล้ว ดังที่ Google เขียนไว้ว่า “เมื่อแอปพลิเคชัน AI ขยายตัว ผู้เผยแพร่เว็บจะเผชิญกับความซับซ้อนที่เพิ่มขึ้นในการจัดการการใช้งานที่แตกต่างกันในวงกว้าง”

อย่างไรก็ตาม นี่เป็นการดำเนินการง่ายๆ สองประการที่ผู้ดูแลเว็บและผู้เผยแพร่ออนไลน์สามารถทำได้

หากคุณเป็นผู้เผยแพร่ออนไลน์และกังวลว่าเนื้อหาของคุณจะถูกนำไปใช้ในการฝึกอบรม AI ได้อย่างไร ให้ดำเนินการง่ายๆ สองอย่างนี้เพื่อบล็อก Chat GPT ของ OpenAI, Bard ของ Google และ Vertex AI ของ Google ไม่ให้เข้าถึงเว็บไซต์ของคุณ

สนใจว่าผู้จัดพิมพ์ใช้ AI อย่างไร

บทความเพิ่มเติมเกี่ยวกับ AI สำหรับผู้เผยแพร่โฆษณาดิจิทัลมีดังนี้

  • ผู้เผยแพร่สื่อรายใหญ่ใช้ AI เพื่อการผลิตเนื้อหาอย่างไร
  • 6 วิธีที่ AI สามารถเพิ่มจำนวนการสมัครสมาชิกได้
  • รายการเครื่องมือ AI สำหรับผู้จัดพิมพ์ขนาดใหญ่
  • บทความเพิ่มเติมเกี่ยวกับ AI สำหรับผู้จัดพิมพ์

โซลูชันการจัดการความสัมพันธ์ของผู้เยี่ยมชม (VRM) ของ Admiral ใช้ประโยชน์จาก AI และการเรียนรู้ของเครื่องจักรในหลายๆ ด้าน และยังคงคิดค้นเครื่องมือใหม่ๆ อย่างต่อเนื่องเพื่อทำให้การเติบโตของความสัมพันธ์และรายได้ของผู้เยี่ยมชมเป็นไปโดยอัตโนมัติ ตัวอย่าง ได้แก่ การผสานรวม ChatGPT เพื่อสร้าง CTA อัตโนมัติเพื่อกระตุ้น Conversion และทริกเกอร์แบบเรียลไทม์โดยพิจารณาจากปริมาณการเข้าชมที่เพิ่มขึ้นอย่างรวดเร็วของผู้เข้าชมด้วย Surge Targeting

ค้นหาว่า VRM สามารถช่วยคุณขับเคลื่อนความสัมพันธ์และรายได้ตลอดเส้นทางของผู้เยี่ยมชมได้อย่างไร

กำหนดเวลาการสาธิต