Cara Menyisih dari Bot Pelatihan AI oleh Google Bard dan OpenAI ChatGPT
Diterbitkan: 2023-11-13Karena kecerdasan buatan baru saja mulai mengubah kehidupan internet (dan kehidupan normal), banyak yang mengajukan pertanyaan etis tentang bagaimana perusahaan yang mengembangkan AI mendapatkan data yang digunakan untuk melatih perangkat lunak ini. Untuk mengatasi masalah ini, OpenAI dan Google telah mengambil langkah-langkah untuk memberikan opsi kepada penerbit untuk mengecualikan konten mereka agar tidak digunakan untuk melatih bot AI.
Penerbit Web Kekhawatiran tentang Bot AI
Penerbit memang berhak khawatir tentang peran konten mereka dalam pelatihan AI, dan mereka mungkin khawatir karena beberapa alasan berbeda.
Hak Cipta dan Penghasilan Konten
Kreator dan penerbit mempunyai hak untuk memperoleh pendapatan dari konten yang mereka sediakan. Siapapun yang memiliki hak cipta harus mendapatkan keuntungan dari penggunaan konten mereka. Hal ini menimbulkan dua kekhawatiran khusus bagi penerbit.
Pertama, perusahaan yang mengembangkan program kecerdasan buatan menggunakan konten penerbit tanpa memberikan kompensasi kepada mereka. Meskipun ini jarang digunakan sebelumnya, program pelatihan adalah salah satu cara agar konten dapat digunakan. Oleh karena itu, penerbit harus memiliki kendali atas apakah mereka akan mengizinkan hal ini (dan mungkin apakah mereka akan mengenakan biaya).
"menyalin dan memproses jutaan gambar yang dilindungi hak cipta secara tidak sah"
- Gugatan Getty Images
Hal inilah yang dibebankan oleh Getty Images, salah satu penyedia foto dan video online terbesar, kepada OpenAI. Getty Images mengklaim 12 juta gambar mereka digunakan “tanpa izin…atau kompensasi.” Gugatan tersebut mencakup beberapa contoh gambar yang menampilkan tanda air Getty Images yang buram.
Gugatan tambahan oleh Getty Images mengklaim Stability AI "menyalin dan memproses jutaan gambar yang dilindungi hak cipta secara tidak sah", dengan contoh file yang dihasilkan dengan logo Getty yang diubah AI.
Perbandingan foto ditampilkan di The Verge
Perubahan Industri Penerbit yang Dibawa oleh AI
Beberapa penerbit mungkin memandang AI sebagai ancaman dalam industri mereka. Bahkan jika mereka menerima bahwa model bisnis mereka pada akhirnya harus berubah karena kemampuan AI, mereka mungkin tidak ingin mempercepat pengembangan perangkat lunak tersebut.
Meskipun mencegah perusahaan AI mengakses penerbit tertentu mungkin berdampak kecil pada pengembangan, beberapa penerbit mungkin menolak hal ini berdasarkan prinsip.
Melindungi Konten Unik
Beberapa penerbit mungkin berharap untuk menjaga konten mereka tetap unik dengan mencegah AI menyalinnya (atau membuat sesuatu yang serupa). Ini bukanlah tantangan baru bagi penerbit online, karena scraper telah lama digunakan untuk mengumpulkan data dari situs web. Namun, ini adalah aspek lain yang mungkin relevan dalam topik yang sangat terspesialisasi atau untuk platform berita.
Pilihan untuk Tidak Mengikuti Pelatihan AI
Tanpa peraturan, penerbit harus secara manual memilih untuk tidak ikut serta dalam pengembangan setiap perusahaan AI. Dua perusahaan utama yang tidak ikut serta adalah OpenAI (pencipta ChatGPT) dan Google (yang memiliki Bard dan Vertex AI).
Beberapa orang di industri penerbitan online melihat hal ini sebagai pilihan biasa, dan salah satu eksekutif menyatakan: “Ini adalah isyarat simbolis…Saya pikir ini adalah upaya yang sia-sia dari pihak saya. Tidak dapat dihindari bahwa hal-hal ini dicerna, dijelajahi, dan dipelajari.”
Meskipun demikian, penerbit kini memiliki opsi untuk tidak ikut serta.
Cara Menyisih dari ChatGPT
Situs tertentu tidak perlu khawatir tentang crawler OpenAI yang mengumpulkan informasi dari kontennya.
Perusahaan mengatakan mereka tidak mengumpulkan data dari konten yang ada di balik paywall atau formulir yang meminta informasi pribadi. Itu juga tidak merayapi situs yang tidak sejalan dengan pedoman konten OpenAI. Semua ini disaring secara otomatis.
Penerbit yang memiliki konten yang tidak diblokir secara otomatis (termasuk sebagian besar penerbit) dapat memblokir GPTBot dengan menambahkan kode dasar ke file robots.txt situs web mereka.
GPTBot diidentifikasi dalam file robots.txt sebagai:
Token agen pengguna: GPTBot
String agen pengguna lengkap: Mozilla/5.0 AppleWebKit/537.36
(KHTML, seperti Gecko; kompatibel; GPTBot/1.0;
+https://openai.com/gptbot)
Untuk memblokir GPTBot sepenuhnya, tambahkan kode berikut ke file robots.txt situs Anda:
Agen pengguna: GPTBot
Larang: /
Untuk memblokir GPTBot secara selektif dari konten tertentu, gunakan contoh berikut untuk memilih folder mana yang bisa dan tidak bisa diakses:
Agen pengguna: GPTBot
Izinkan: /direktori-1/
Larang: /direktori-2/
Ini seperti memblokir Google atau perayap mesin pencari lainnya untuk mengakses situs web atau folder.
Cara Menyisih dari Google Bard
Google menyediakan pilihan untuk tidak ikut serta untuk Bard AI dan Vertex AI pada bulan September 2023. Pilihan untuk tidak ikut serta dilakukan dengan cara yang hampir sama seperti pilihan tidak ikut serta OpenAI.
Untuk memblokir perayap AI Google, tambahkan kode berikut ke file robots.txt situs Anda:
Agen pengguna: Google-Extend
Larang: /
Seperti halnya bot OpenAI, Anda juga dapat memberikan beberapa akses kepada Google, namun tidak sepenuhnya:
Agen pengguna: Google-Extend
Izinkan: /direktori-1/
Larang: /direktori-2/
"Mereka memperlakukan semuanya sebagai satu produk pencarian besar."
- Matt Rogerson, Penjaga
Sebelum memilih untuk tidak ikut serta, webmaster dan penerbit harus menyadari bahwa hal ini mungkin berarti situs juga tidak dirayapi untuk pengindeksan penelusuran. Seperti yang dikatakan Matt Rogerson dari The Guardian, ini adalah “pengikis yang dibundel.” Dia menjelaskan: “Mereka memperlakukan semuanya sebagai satu produk pencarian besar. Mereka seperti, 'Tidak, Anda tidak mendapatkan pilihan perincian. Kami memberi Anda kesempatan untuk memilih tidak ikut serta.' Namun yang jelas, kami tidak ingin menyisih dari semua perayapan web.”
Blokir Bot Pelatihan AI dari Konten Anda
Solusi ini tidak sempurna. Sejauh ini, pendekatan ini hanya menangani dua pengembang AI (misalnya, bukan Microsoft), dan semua perusahaan di bidang ini telah mengumpulkan data dalam jumlah besar. Seperti yang ditulis Google, “Seiring dengan berkembangnya aplikasi AI, penerbit web akan menghadapi semakin kompleksnya pengelolaan berbagai penggunaan dalam skala besar.”
Namun, ini adalah dua tindakan sederhana yang dapat dilakukan oleh webmaster dan penerbit online.
Jika Anda seorang penerbit online dan khawatir tentang bagaimana konten Anda dapat digunakan untuk pelatihan AI, lakukan dua tindakan sederhana ini untuk memblokir GPT Obrolan OpenAI, Bard Google, dan Vertex AI Google agar tidak mengakses situs web Anda.
Tertarik dengan Bagaimana AI Digunakan oleh Penerbit?
Berikut beberapa artikel tambahan tentang AI untuk penerbit digital:
- Bagaimana Pub Media Besar Menggunakan AI untuk Produksi Konten
- 6 Cara AI Dapat Menumbuhkan Langganan
- Megalist Alat AI untuk Penerbit
- Artikel lainnya tentang AI untuk Penerbit
Solusi Manajemen Hubungan Pengunjung (VRM) Admiral memanfaatkan AI dan pembelajaran mesin dalam berbagai cara dan terus berinovasi dalam alat untuk mengotomatisasi pertumbuhan hubungan dan pendapatan pengunjung. Contohnya termasuk integrasi ChatGPT untuk mengotomatiskan pembuatan CTA guna mendorong konversi, dan pemicu real-time berdasarkan lonjakan lalu lintas pengunjung dengan Surge Targeting.
Cari tahu bagaimana VRM dapat membantu Anda meningkatkan hubungan dan pendapatan di seluruh perjalanan pengunjung.