Cum să renunțați la AI Training Bots de Google Bard și OpenAI ChatGPT

Publicat: 2023-11-13

Întrucât inteligența artificială tocmai a început să răstoarne o mare parte din viața internetului (și normală), mulți ridică întrebări etice cu privire la modul în care companiile care dezvoltă inteligența artificială obțin datele care sunt utilizate pentru antrenarea acestui software. Pentru a răspunde acestor preocupări, atât OpenAI, cât și Google au luat măsuri pentru a oferi editorilor o opțiune de a exclude conținutul lor de a fi folosit pentru a antrena roboții AI.

Preocupările editorilor web cu privire la AI Bots

Editorii au dreptate să fie îngrijorați de rolul pe care îl are conținutul lor în formarea AI și ar putea fi îngrijorați din câteva motive diferite.

Drepturi de autor pentru conținut și câștiguri

Creatorii și editorii au dreptul de a câștiga venituri din conținutul pe care îl pun la dispoziție. Oricine are dreptul de autor ar trebui să beneficieze de utilizarea conținutului său. Acest lucru ridică două preocupări specifice pentru editori.

În primul rând, companiile care dezvoltă programe de inteligență artificială folosesc conținutul editorilor fără a le compensa. Deși aceasta este o utilizare neobișnuită anterior, programele de antrenament sunt o modalitate prin care conținutul poate fi utilizat. Prin urmare, editorii ar trebui să aibă control asupra dacă vor permite acest lucru (și poate dacă ar percepe).

„copiat și procesat ilegal milioane de imagini protejate prin drepturi de autor”
- Proces Getty Images

Este exact ceea ce Getty Images, unul dintre cei mai mari furnizori online de fotografii și videoclipuri, a taxat OpenAI. Getty Images susține că cele 12 milioane de imagini ale lor au fost folosite „fără permisiune... sau compensație”. Procesul include mai multe exemple de imagini care prezintă un filigran Getty Images neclar.

Un proces suplimentar al Getty Images susține că Stability AI a „copiat și procesat ilegal milioane de imagini protejate prin drepturi de autor”, cu exemple de fișiere produse cu siglele Getty modificate de AI.

Getty Images combate încălcarea drepturilor de autor împotriva stabilității AI - BeyondGames.biz

Comparație de fotografii prezentate pe The Verge

Schimbări în industria editorilor aduse de AI

Unii editori pot vedea AI ca o amenințare în industria lor. Chiar dacă acceptă că modelul lor de afaceri va trebui să se schimbe în cele din urmă din cauza capacităților AI, este posibil să nu vrea să accelereze dezvoltarea software-ului.

Deși împiedicarea companiilor de inteligență artificială să acceseze un anumit editor ar putea avea un efect neglijabil asupra dezvoltării, unii editori ar putea obiecta la acest lucru pe baza unui principiu.

Protejarea conținutului unic

Câțiva editori ar putea spera să-și păstreze conținutul unic, împiedicând AI să îl copieze (sau să facă ceva similar). Aceasta nu este o provocare nouă pentru editorii online, deoarece scraperele sunt folosite de multă vreme pentru a colecta date de pe site-uri web. Este o altă fațetă care ar putea fi relevantă în nișele foarte specializate sau pentru platformele de știri, totuși.

Opțiuni pentru a renunța la formarea AI

Fără reglementări, editorii trebuie să renunțe manual la dezvoltarea fiecărei companii AI. Principalele două de la care să renunțe sunt OpenAI (creatorul ChatGPT) și Google (care are Bard și Vertex AI).

Unii din industria publicării online văd asta ca pe o opțiune nominală, un director executiv declarând: „Este un gest simbolic... Cred că a fost un efort irosit din partea mea. Este inevitabil faptul că aceste lucruri sunt ingerate și târâte și din care se învață.”

Cu toate acestea, editorii au acum opțiunea de a renunța.

Cum să renunți la ChatGPT

Anumite site-uri nu trebuie să-și facă griji că crawler-ul OpenAI adună informații din conținutul lor.

Compania spune că nu adună date din conținutul care se află în spatele unui paywall sau a unui formular care solicită informații personale. De asemenea, nu accesează cu crawlere site-urile care nu sunt aliniate cu regulile de conținut ale OpenAI. Toate acestea sunt filtrate automat.

Editorii care au conținut care nu este exclus automat (care include majoritatea editorilor) pot bloca GPTBot adăugând cod de bază în fișierul robots.txt al site-ului lor web.

GPTBot este identificat într-un fișier robots.txt ca:

Indicativ utilizator-agent: GPTBot
Șir complet user-agent: Mozilla/5.0 AppleWebKit/537.36
(KHTML, ca Gecko; compatibil; GPTBot/1.0;
+https://openai.com/gptbot)

Pentru a bloca complet GPTBot, adăugați următoarele în fișierul robots.txt al site-ului dvs.:

Agent utilizator: GPTBot
Nu permite: /

Pentru a bloca selectiv GPTBot de la un anumit conținut, utilizați următorul exemplu pentru a selecta folderele care pot și nu pot fi accesate:

Agent utilizator: GPTBot
Permite: /director-1/
Nu permiteți: /directory-2/

Acest lucru este asemănător cu blocarea accesării crawlerelor Google sau a altui motor de căutare pe un site web sau dosare.

Cum să renunțați la Google Bard

Google a pus la dispoziție o renunțare pentru Bard AI și Vertex AI în septembrie 2023. Renunțarea este executată în același mod ca și renunțarea OpenAI.

Pentru a bloca crawlerul AI al Google, adăugați următorul cod în fișierul robots.txt al site-ului dvs.:

User-agent: Google-Extended
Nu permite: /

Ca și în cazul bot-ului OpenAI, puteți oferi Google acces, dar nu total:

User-agent: Google-Extended
Permite: /director-1/
Nu permiteți: /directory-2/

„Ei tratează totul ca pe un produs mare de căutare”.
- Matt Rogerson, The Guardian

Înainte de a renunța, webmasterii și editorii ar trebui să știe că acest lucru va însemna probabil că nici un site nu este accesat cu crawlere pentru indexarea căutării. După cum a spus Matt Rogerson de la The Guardian, acestea sunt „răzuitoare în pachet”. El a explicat: „Ei tratează totul ca pe un produs mare de căutare. Ei spun: „Nu, nu ai alegerea de granularitate. Vă oferim posibilitatea de a renunța.' Dar, evident, nu vrem să renunțăm la toate accesările cu crawlere pe web.”

Blocați roboții de antrenament AI din conținutul dvs

Această soluție nu este perfectă. Se adresează până acum doar a doi dezvoltatori AI (de exemplu, nu Microsoft), iar toate companiile din acest domeniu au colectat deja cantități mari de date. După cum a scris Google, „Pe măsură ce aplicațiile AI se extind, editorii web se vor confrunta cu complexitatea crescândă a gestionării diferitelor utilizări la scară”.

Acestea sunt două acțiuni simple pe care le pot întreprinde webmasterii și editorii online.

Dacă sunteți un editor online și vă preocupați cum ar putea fi folosit conținutul dvs. pentru instruirea AI, luați aceste două acțiuni simple pentru a bloca accesul la site-ul dvs. web pentru Chat GPT, Google Bard și Google Vertex AI.

Vă interesează cum este folosită AI de către editori?

Iată câteva articole suplimentare despre AI pentru editorii digitali:

Cum folosesc marile pub-uri media AI pentru producerea de conținut
6 moduri prin care AI poate crește abonamentele
Megalist de instrumente AI pentru editori
Mai multe articole despre AI for Publishers

Soluția de management al relațiilor cu vizitatorii (VRM) de la Admiral folosește inteligența artificială și învățarea automată în mai multe moduri și continuă să inoveze instrumente pentru a automatiza creșterea relațiilor cu vizitatorii și a veniturilor. Exemplele includ integrarea ChatGPT pentru a automatiza generarea de CTA pentru a genera conversii și declanșatoare în timp real bazate pe creșterile de trafic ale vizitatorilor cu direcționarea în creștere.

Aflați cum VRM vă poate ajuta să generați relații și venituri pe parcursul călătoriei vizitatorilor.

Programați o demonstrație