Détecteurs de contenu IA. En valent-ils la peine ? | L'IA en entreprise #38

Publié: 2023-11-24

Vous souvenez-vous de l'époque où, il y a quelques années, nous étions enthousiasmés par les premiers articles générés par l'IA qui ressemblaient à peine à de la prose humaine ? Aujourd’hui, alors que l’IA peut écrire des essais presque poétiques, nombreux sont ceux qui se demandent comment distinguer le travail d’une machine de celui d’un humain. Et OpenAI, la société à l’origine du succès de ChatGPT, a définitivement fermé l’accès à son détecteur d’IA en raison de son inefficacité.

Détecteurs de contenu IA – table des matières :

Détecteurs de contenu IA
Pourquoi utiliser des détecteurs de contenu IA ?
Manque de fiabilité des détecteurs de contenu AI. Réalité ou mythe ?
Éviter la détection de l'IA par l'IA. Est-ce possible et comment ?
L'avenir de la détection de contenu IA. Orientations de développement et innovations

Aujourd’hui, les développeurs de détecteurs de contenu IA les présentent comme des outils permettant de préserver l’authenticité. La question est : valent-ils la confiance et l’investissement ? Dans cet article, nous examinerons le fonctionnement des détecteurs de contenu IA, les raisons pour lesquelles ils pourraient disparaître, les défis qu'ils posent et les dilemmes éthiques qu'ils posent.

Détecteurs de contenu IA

Les détecteurs de contenu IA sont basés sur des modèles linguistiques similaires à ceux utilisés pour générer du contenu IA. Ils peuvent être divisés en ceux dont la tâche est de vérifier l’origine des images, des textes et de la musique générés avec l’aide de l’intelligence artificielle. Chaque type de « détecteur d’IA » fonctionne légèrement différemment, mais aucun d’entre eux ne peut faire la distinction avec une certitude absolue entre le contenu créé par l’homme et celui généré par l’IA.

Les détecteurs d’images générés par l’IA jouent un rôle de plus en plus important en raison du pouvoir des médias à générer de fausses nouvelles. Ils analysent les anomalies, les styles et modèles distinctifs et recherchent les signes laissés par des modèles tels que DALL-E.

Parmi les détecteurs utilisés pour identifier les images, l'outil « AI or Not » d'Optic, qui utilise les bases de données d'images générées par Midjourney, DALL-E et Stable Diffusion, est l'un des principaux détecteurs. Bien que les résultats soient incertains, il s’agit d’une étape vers le développement de méthodes d’identification plus précises à l’avenir.

Source : IA ou pas (https://www.aiornot.com/)

Derrière le fonctionnement des détecteurs d’IA qui reconnaissent les textes générés par l’IA se cachent des algorithmes avancés qui analysent la structure et le choix des mots du texte, puis reconnaissent les modèles spécifiques à l’IA. Ils utilisent :

classificateurs – un algorithme qui classe le texte et vérifie le style, le ton et la grammaire. Par exemple, une description de produit qui pourrait correspondre à n'importe quel produit de ce type pourrait être classée comme une création IA,
intégrations (embeddings) – les représentations numériques des mots permettent aux machines de comprendre le contexte de leur utilisation. C'est grâce à eux que le programme « comprend » qu'un texte avec une sélection monotone de mots peut être l'œuvre de l'IA,
perplexité – qui est une mesure de l’imprévisibilité d’un texte. Les textes écrits par des humains ont tendance à être plus perplexes, bien que les textes qui sont intrinsèquement simples, utilitaires dans leur forme typique ou écrits par des étrangers puissent être classés à tort comme générés par l'IA.
diversité (rapidité) – ce facteur décrit la variabilité de la longueur et de la structure des phrases. Les humains ont tendance à écrire des textes plus variés que l’intelligence artificielle.

Les éléments mentionnés ci-dessus sont utilisés ensemble par les détecteurs de contenu IA pour évaluer s’il s’agit d’un texte créé par l’homme ou par une machine.

Pourquoi utiliser des détecteurs de contenu IA ?

Les détecteurs de contenu IA fonctionnent dans une variété de domaines, de l'éducation au marketing et au recrutement. Voici les principales raisons de les utiliser comme outil d'aide à l'évaluation, mais pas comme preuve définitive de la génération ou non du contenu :

Identification de photos modifiées par l'IA représentant des personnes connues – pour détecter si la photo représente une situation réelle,
Prévenir la désinformation – Dans le contexte de la lutte contre la désinformation, des détecteurs de contenu IA efficaces aident les modérateurs des réseaux sociaux à détecter la diffusion de fausses informations afin d'identifier et d'éliminer les contenus répétitifs générés par les robots,
Limiter la publication de textes de faible valeur – Les détecteurs de contenu IA peuvent aider les éditeurs à rejeter les textes contenant des informations génériques générées par ChatGPT, Bing ou Bard après avoir tapé une simple requête.

Il convient toutefois de rappeler que l'origine du texte ne constitue pas une base pour la baisse du classement d'un site par Google. Le blog du Centre de recherche de Google indique qu'il est essentiel pour Google de « récompenser le contenu de qualité, quelle que soit la manière dont il est créé […]. L'automatisation est utilisée depuis longtemps pour générer du contenu utile, tel que des résultats sportifs, des prévisions météorologiques et des transcriptions. L’IA peut ouvrir de nouveaux niveaux d’expression et de créativité et constituer un outil clé pour soutenir la création d’un contenu Web de qualité.

Manque de fiabilité des détecteurs de contenu AI. Réalité ou mythe ?

Bien que les détecteurs de contenu IA soient omniprésents, leur efficacité peut être discutable. Les principaux problèmes sont :

faible efficacité dans la détection du contenu de l'IA,
problèmes de faux positifs, ainsi que
difficultés d’adaptation des détecteurs à la diversification et à l’amélioration rapides des nouveaux modèles d’IA.

Les tests menés par OpenAI ont montré que leur classificateur ne reconnaissait le texte généré par GPT que 26 % du temps. Un exemple intéressant du manque de fiabilité des générateurs peut être vu dans une expérience menée par TechCrunch, qui a montré que l'outil GPTZero a correctement identifié cinq des sept textes générés par l'IA. Alors que le classificateur OpenAI n’en a identifié qu’un.

Source : GPTZero (https://gptzero.me/)

De plus, il existe un risque de recevoir un faux positif, c’est-à-dire d’identifier un texte écrit par un humain comme généré par l’IA. Par exemple, le début du deuxième chapitre de Don Quichotte de Miguel de Cervantes a été marqué par le détecteur OpenAI comme étant très probablement écrit par l'intelligence artificielle.

Si les erreurs dans l’analyse des textes littéraires historiques peuvent être traitées comme une curiosité amusante, la situation se complique lorsque l’on veut utiliser les détecteurs comme outils d’évaluation des textes. La Constitution américaine a été marquée par ZeroGPT comme étant rédigée à 92,15 % par l’intelligence artificielle. Et, selon une étude publiée par des chercheurs de l’Université de Stanford, 61 % des essais du TOEFL rédigés par des étudiants non anglophones ont été classés comme générés par l’IA. Malheureusement, il n’existe aucune donnée sur le pourcentage de textes faussement classés comme positifs dans d’autres langues.

Un autre problème est le changement de classification lors des essais ultérieurs du détecteur. En effet, il arrive souvent qu'un détecteur tel que ZeroGPT ou Scribbr modifie la classification des fragments de texte, qu'il marque une fois comme générés par l'IA et une autre fois comme écrits par l'homme.

Source : Scribbr (https://www.scribbr.com/ai-detector/)

Les détecteurs d’images et de vidéos IA sont principalement utilisés pour identifier les deepfakes et autres contenus générés par l’IA qui peuvent être utilisés pour diffuser de la désinformation.

Les outils de détection actuels tels que Deepware, Illuminarty et FakeCatcher ne fournissent pas de résultats de tests sur leur fiabilité. Dans le contexte juridique de la détection du matériel visuel généré par l’IA, il existe des initiatives visant à ajouter des filigranes aux images de l’IA. Cependant, il s’agit d’une méthode très peu fiable : vous pouvez simplement télécharger une image sans filigrane. Midjourney adopte une approche différente du filigrane, laissant aux utilisateurs le soin de décider s'ils souhaitent filigraner une image de cette manière.

Éviter la détection de l’IA. Est-ce possible et comment ?

Les entrepreneurs doivent être conscients que les détecteurs de contenu IA ne remplacent pas l’évaluation humaine de la qualité et ne sont pas toujours fiables. Leurs problèmes pratiques de maintenance peuvent poser des difficultés considérables, tout comme essayer d'éviter que votre contenu soit classé comme généré par l'IA. Surtout lorsque l’IA est simplement un outil entre les mains d’un professionnel – c’est-à-dire qu’il ne s’agit pas d’un « contenu généré par l’IA », mais plutôt d’un « contenu créé en collaboration avec l’IA ».

Il est relativement simple d'ajouter quelqu'un aux matériaux générés, la manière dont ils sont créés est donc très difficile à détecter. Si la personne qui utilise l’IA générative sait quel effet obtenir, elle peut simplement modifier manuellement les résultats.

La question fondamentale réside dans la raison pour laquelle nous souhaitons éviter la détection si le contenu a été généré par l’IA.

S’il s’agit d’une question éthique qui concerne, par exemple, la paternité d’une recherche scientifique publiée, il faut s’en remettre à l’éthique professionnelle du scientifique et à l’utilisation responsable des outils basés sur l’IA.
Si l’employeur souhaite que ses employés refusent d’utiliser l’IA, il reste un accord contractuel pour l’utilisation de l’intelligence artificielle générative.

Cela soulève également la question de savoir si nous voulons promouvoir une utilisation responsable de l’IA par le biais d’interdictions et de détracteurs (ZeroGPT et GPTZero !), ou par une appréciation de la transparence, de l’instauration de la confiance et d’une utilisation honnête des technologies avancées.

Source : ZeroGPT (https://www.zerogpt.com/)

Résumé

La réponse à la question de savoir si les détecteurs de contenu IA valent la peine d’être utilisés est loin d’être claire. Les détecteurs de contenu IA sont encore en développement et leur avenir est difficile à prédire. Une chose est sûre : ils évolueront avec le développement de la technologie de l’IA. Les progrès de l’IA, notamment la capacité croissante des modèles linguistiques à imiter le style d’écriture humain, signifient que la détection du contenu de l’IA pourrait devenir encore plus compliquée. Pour les entreprises, c'est le signe qu'il faut suivre ces évolutions et ne pas s'appuyer uniquement sur les outils, mais sur leur évaluation du contenu et de son adéquation à l'usage pour lequel il a été créé. Et d’utiliser judicieusement l’intelligence artificielle qui se développe rapidement.

Si vous aimez notre contenu, rejoignez notre communauté d'abeilles très active sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Auteur : Robert Whitney
Expert JavaScript et instructeur qui coache les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en apprenant aux autres comment coopérer efficacement lors du codage.
Afficher tous les messages

L'IA en entreprise :

Menaces et opportunités de l’IA en entreprise (partie 1)
Menaces et opportunités de l’IA en entreprise (partie 2)
Applications de l'IA en entreprise - aperçu
Chatbots textuels assistés par l'IA
La PNL commerciale aujourd'hui et demain
Le rôle de l’IA dans la prise de décision en entreprise
Planification des publications sur les réseaux sociaux. Comment l’IA peut-elle aider ?
Publications automatisées sur les réseaux sociaux
Nouveaux services et produits fonctionnant avec l’IA
Quelles sont les faiblesses de mon idée d’entreprise ? Une séance de brainstorming avec ChatGPT
Utiliser ChatGPT en entreprise
Acteurs synthétiques. Top 3 des générateurs vidéo IA
3 outils de conception graphique IA utiles. L'IA générative en entreprise
3 superbes rédacteurs d'IA que vous devez essayer aujourd'hui
Explorer la puissance de l'IA dans la création musicale
Naviguer dans de nouvelles opportunités commerciales avec ChatGPT-4
Outils d'IA pour le manager
6 superbes plugins ChatGTP qui vous faciliteront la vie
3 graphiques AI. Génération d'intelligence pour l'entreprise
Quel est l’avenir de l’IA selon McKinsey Global Institute ?
L'intelligence artificielle en entreprise - Introduction
Qu'est-ce que la PNL, ou traitement du langage naturel en entreprise
Traitement automatique des documents
Google Traduction contre DeepL. 5 applications de la traduction automatique pour les entreprises
Le fonctionnement et les applications métiers des voicebots
La technologie des assistants virtuels, ou comment parler à l’IA ?
Qu’est-ce que la Business Intelligence ?
L’intelligence artificielle va-t-elle remplacer les analystes commerciaux ?
Comment l’intelligence artificielle peut-elle aider avec le BPM ?
IA et réseaux sociaux : que disent-ils de nous ?
L'intelligence artificielle dans la gestion de contenu
L'IA créative d'aujourd'hui et de demain
L'IA multimodale et ses applications en entreprise
De nouvelles interactions. Comment l’IA change-t-elle la façon dont nous utilisons les appareils ?
RPA et API dans une entreprise numérique
Le futur marché du travail et les métiers à venir
L'IA dans l'EdTech. 3 exemples d’entreprises qui ont utilisé le potentiel de l’intelligence artificielle
Intelligence artificielle et environnement. 3 solutions d'IA pour vous aider à bâtir une entreprise durable
Détecteurs de contenu IA. En valent-ils la peine ?