Google Bard ve OpenAI ChatGPT'nin Yapay Zeka Eğitim Botlarından Nasıl Çıkılır?

Yayınlanan: 2023-11-13

Yapay zeka internet (ve normal) yaşamının çoğunu altüst etmeye başladığından beri, birçok kişi yapay zekayı geliştiren şirketlerin bu yazılımı eğitmek için kullanılan verileri nasıl elde ettiği konusunda etik sorular ortaya atıyor. Bu endişeleri gidermek için hem OpenAI hem de Google, yayıncılara içeriklerinin yapay zeka botlarını eğitmek için kullanılmasını engelleme seçeneği sunmak üzere adımlar attı.

Web Yayıncılarının Yapay Zeka Botlarına İlişkin Kaygıları

Yayıncılar, içeriklerinin yapay zeka eğitimindeki rolü konusunda endişelenmekte haklıdır ve birkaç farklı nedenden dolayı endişe duyabilirler.

İçerik Telif Hakkı ve Kazançlar

İçerik oluşturucular ve yayıncılar, kullanıma sundukları içerikten gelir elde etme hakkına sahiptir. Telif hakkına sahip olan kişi, içeriğin kullanımından faydalanmalıdır. Bu durum yayıncılar için iki spesifik endişeyi gündeme getiriyor.

Birincisi, yapay zeka programları geliştiren şirketler, yayıncıların içeriklerini karşılıksız olarak kullanıyor. Her ne kadar bu daha önce alışılmadık bir kullanım olsa da, eğitim programları içeriğin kullanılabileceği bir yoldur. Bu nedenle yayıncıların buna izin verip vermeyecekleri (ve belki de ücret alıp almayacakları) konusunda kontrol sahibi olmaları gerekir.

"Telif haklarıyla korunan milyonlarca görselin hukuka aykırı olarak kopyalanması ve işlenmesi"
- Getty Images davası

Bu tam olarak en büyük çevrimiçi fotoğraf ve video sağlayıcılarından biri olan Getty Images'ın OpenAI'yi ücretlendirdiği şey. Getty Images, 12 milyon görselin "izinsiz... veya tazminatsız" kullanıldığını iddia ediyor. Dava, bulanık Getty Images filigranı içeren çok sayıda görsel örneğini içeriyor.

Getty Images tarafından açılan ek bir dava, Stabilite AI'nın, AI ile değiştirilmiş Getty logolarıyla üretilen dosya örnekleriyle birlikte "telif hakkıyla korunan milyonlarca görüntüyü yasa dışı olarak kopyaladığını ve işlediğini" iddia ediyor.

Getty Images, Yapay Zeka Kararlılığına Karşı Telif Hakkı İhlalleriyle Mücadele Ediyor - BeyondGames.biz

The Verge'da öne çıkan fotoğraf karşılaştırması

Yapay Zekanın Getirdiği Yayıncı Sektöründe Değişiklikler

Bazı yayıncılar yapay zekayı kendi sektörlerinde bir tehdit olarak görebilir. Yapay zekanın yetenekleri nedeniyle iş modellerinin eninde sonunda değişmesi gerekeceğini kabul etseler bile yazılımın gelişimini hızlandırmak istemeyebilirler.

Yapay zeka şirketlerinin belirli bir yayıncıya erişmesinin engellenmesi, geliştirme üzerinde ihmal edilebilir bir etkiye sahip olsa da, bazı yayıncılar prensip gereği buna itiraz edebilir.

Benzersiz İçeriğin Korunması

Birkaç yayıncı, yapay zekanın içeriği kopyalamasını (veya benzer bir şey yapmasını) engelleyerek içeriklerini benzersiz tutmayı umut edebilir. Kazıyıcılar uzun süredir web sitelerinden veri toplamak için kullanıldığından, bu çevrimiçi yayıncılar için yeni bir zorluk değil. Ancak bu, son derece uzmanlaşmış nişler veya haber platformları için geçerli olabilecek başka bir yöndür.

Yapay Zeka Eğitiminden Çıkma Seçenekleri

Düzenleme olmadığında yayıncıların her yapay zeka şirketinin geliştirme sürecinden manuel olarak vazgeçmesi gerekiyor. Devre dışı bırakılacak iki ana kişi OpenAI (ChatGPT'nin yaratıcısı) ve Google'dır (Bard ve Vertex AI'ye sahiptir).

Çevrimiçi yayıncılık sektöründen bazıları bunu nominal bir seçenek olarak görüyor ve bir yönetici şunu belirtiyor: “Bu sembolik bir jest…Bunun benim açımdan boşa giden bir çaba olduğunu düşünüyorum. Bu şeyin yutulması, taranması ve öğrenilmesi kaçınılmazdır."

Bununla birlikte, yayıncıların artık kapsam dışında kalma seçeneği bulunmaktadır.

ChatGPT'den Nasıl Çıkılır?

Bazı sitelerin OpenAI tarayıcısının içeriklerinden bilgi toplaması konusunda endişelenmesine gerek yoktur.

Şirket, ödeme duvarının veya kişisel bilgi isteyen bir formun arkasındaki içerikten veri toplamadığını söylüyor. Ayrıca OpenAI'nin içerik yönergelerine uygun olmayan siteleri de taramaz. Bunların hepsi otomatik olarak filtrelenir.

Otomatik olarak engellenmeyen içeriğe sahip yayıncılar (çoğu yayıncı dahil), web sitelerinin robots.txt dosyasına temel kod ekleyerek GPTBot'u engelleyebilir.

GPTBot, bir robots.txt dosyasında şu şekilde tanımlanır:

Kullanıcı aracısı belirteci: GPTBot
Tam kullanıcı aracısı dizesi: Mozilla/5.0 AppleWebKit/537.36
(KHTML, Gecko gibi; uyumlu; GPTBot/1.0;
+https://openai.com/gptbot)

GPTBot'u tamamen engellemek için sitenizin robots.txt dosyasına aşağıdakini ekleyin:

Kullanıcı aracısı: GPTBot
İzin verme: /

GPTBot'u belirli içeriklerden seçerek engellemek için, hangi klasörlere erişilip erişilemeyeceğini seçmek için aşağıdaki örneği kullanın:

Kullanıcı aracısı: GPTBot
İzin ver: /dizin-1/
İzin verme: /dizin-2/

Bu, Google'ın veya başka bir arama motorunun tarayıcılarının bir web sitesine veya klasörlere erişmesini engellemeye benzer.

Google Bard'dan Nasıl Çıkılır?

Google, Eylül 2023'te Bard AI ve Vertex AI için devre dışı bırakma seçeneğini kullanıma sundu. Devre dışı bırakma, OpenAI'nin devre dışı bırakılmasıyla hemen hemen aynı şekilde gerçekleştirilir.

Google'ın AI tarayıcısını engellemek için sitenizin robots.txt dosyasına aşağıdaki kodu ekleyin:

Kullanıcı aracısı: Google Genişletilmiş
İzin verme: /

OpenAI'nin botunda olduğu gibi, Google'a tam olmasa da bir miktar erişim de verebilirsiniz:

Kullanıcı aracısı: Google Genişletilmiş
İzin ver: /dizin-1/
İzin verme: /dizin-2/

"Hepsine büyük bir arama ürünü gibi davranıyorlar."
- Matt Rogerson, Gardiyan

Bu seçeneği devre dışı bırakmadan önce web yöneticileri ve yayıncılar, bunun muhtemelen bir sitenin arama dizine ekleme amacıyla da taranmadığı anlamına geleceğini bilmelidir. The Guardian'dan Matt Rogerson'un belirttiği gibi bunlar "paket halindeki kazıyıcılardır." Şunları açıkladı: "Hepsini büyük bir arama ürünü olarak ele alıyorlar. 'Hayır, ayrıntı düzeyi seçeneğini alamıyorsunuz' diyorlar. Size vazgeçme fırsatı veriyoruz.' Ancak açıkçası tüm web taramalarının kapsamı dışında kalmak istemiyoruz."

İçeriğinizdeki AI Eğitim Botlarını Engelleyin

Bu çözüm mükemmel değil. Şu ana kadar yalnızca iki yapay zeka geliştiricisine hitap ediyor (örneğin Microsoft'a değil) ve bu alandaki tüm şirketler zaten çok büyük miktarda veriyi toplamış durumda. Google'ın yazdığı gibi, "Yapay zeka uygulamaları genişledikçe, web yayıncıları farklı kullanımları geniş ölçekte yönetmenin artan karmaşıklığıyla karşı karşıya kalacak."

Ancak bunlar web yöneticilerinin ve çevrimiçi yayıncıların gerçekleştirebileceği iki basit eylemdir.

Çevrimiçi bir yayıncıysanız ve içeriğinizin yapay zeka eğitimi için nasıl kullanılabileceği konusunda endişeleriniz varsa OpenAI Chat GPT, Google Bard ve Google Vertex AI'nin web sitenize erişimini engellemek için bu iki basit eylemi gerçekleştirin.

Yapay Zekanın Yayıncılar Tarafından Nasıl Kullanıldığıyla İlgileniyor musunuz?

Dijital yayıncılara yönelik yapay zeka hakkında bazı ek makaleler şunlardır:

  • Büyük Media Pub'lar İçerik Üretimi için Yapay Zekayı Nasıl Kullanıyor?
  • Yapay Zekanın Abonelikleri Artırmanın 6 Yolu
  • Yayıncılara Yönelik Yapay Zeka Araçları Megalisti
  • Yayıncılar için AI hakkında daha fazla makale

Admiral'in Ziyaretçi İlişkileri Yönetimi (VRM) çözümü, yapay zeka ve makine öğreniminden çeşitli şekillerde yararlanıyor ve ziyaretçi ilişkilerinin ve gelirin büyümesini otomatikleştirmek için araçlar geliştirmeye devam ediyor. Örnekler arasında, dönüşümleri artırmak için CTA oluşturmayı otomatikleştirmek üzere ChatGPT entegrasyonu ve Artış Hedefleme ile ziyaretçi trafiğindeki artışlara dayalı gerçek zamanlı tetikleyiciler yer alır.

VRM'nin ziyaretçi yolculuğu boyunca ilişkileri ve geliri artırmanıza nasıl yardımcı olabileceğini öğrenin.

Demo Planlayın