Детекторы контента AI. Стоят ли они того? | ИИ в бизнесе №38

Опубликовано: 2023-11-24

Помните, несколько лет назад мы были в восторге от первых статей, созданных ИИ, которые едва напоминали человеческую прозу? Сегодня, когда ИИ может писать почти поэтические эссе, многие люди задаются вопросом, как отличить работу машины от работы человека. А OpenAI, компания, стоящая за успехом ChatGPT, навсегда закрыла доступ к своему детектору искусственного интеллекта из-за его неэффективности.

Детекторы контента AI – оглавление:

Детекторы контента с искусственным интеллектом
Зачем использовать детекторы контента AI?
Ненадежность детекторов контента AI. Реальность или миф?
Как избежать обнаружения ИИ с помощью ИИ. Возможно ли это и как?
Будущее обнаружения контента с помощью ИИ. Направления развития и инновации

Сегодня разработчики ИИ-детекторов контента представляют их как инструменты для защиты аутентичности. Вопрос в том, стоят ли они доверия и инвестиций? В этой статье мы рассмотрим, как работают детекторы контента ИИ, почему они могут исчезнуть, какие проблемы они создают и какие этические дилеммы они создают.

Детекторы контента с искусственным интеллектом

Детекторы контента AI основаны на языковых моделях, аналогичных тем, которые используются для создания контента AI. Их можно разделить на те, задачей которых является проверка происхождения изображений, текстов и музыки, созданных при поддержке искусственного интеллекта. Каждый тип «детектора ИИ» работает немного по-своему, но ни один из них не может с абсолютной уверенностью отличить контент, созданный человеком, от контента, созданного ИИ.

Детекторы изображений, генерируемые искусственным интеллектом, играют все более важную роль из-за способности СМИ генерировать фейковые новости. Они анализируют аномалии, отличительные стили и узоры и ищут следы, оставленные такими моделями, как DALL-E.

Среди детекторов, используемых для идентификации изображений, выделяется инструмент «AI or Not» от Optic, который использует базы данных изображений, созданные Midjourney, DALL-E и Stable Diffusion. Хотя результаты неопределенны, это шаг к разработке более точных методов идентификации в будущем.

Источник: AI или нет (https://www.aiornot.com/)

За работой детекторов ИИ, которые распознают тексты, сгенерированные ИИ, стоят передовые алгоритмы, которые анализируют структуру и выбор слов в тексте, а затем распознают шаблоны, специфичные для ИИ. Они используют:

классификаторы — алгоритм, который классифицирует текст и проверяет стиль, тон и грамматику. Например, описание продукта, подходящее к любому продукту этого типа, может быть классифицировано как творение ИИ.
эмбеддинги (embeddings) – числовые представления слов позволяют машинам понимать контекст их использования. Именно благодаря им программа «понимает», что текст с монотонным подбором слов может быть делом рук ИИ,
недоумение – мера непредсказуемости текста. Тексты, написанные людьми, как правило, вызывают большее недоумение, хотя тексты, которые по своей сути просты, утилитарны в типичной форме или написаны иностранцами, могут быть ошибочно классифицированы как созданные ИИ.
разнообразие (пакетность) – этот фактор описывает изменчивость длины и структуры предложения. Люди склонны писать более разнообразные тексты, чем искусственный интеллект.

Вышеупомянутые элементы вместе используются детекторами контента ИИ для оценки того, имеем ли мы дело с рукотворным или машинным текстом.

Зачем использовать детекторы контента AI?

Детекторы контента с помощью ИИ работают в самых разных областях — от образования до маркетинга и подбора персонала. Вот основные причины использовать их в качестве инструмента, помогающего в оценке, но не в качестве окончательного доказательства того, был ли создан контент:

Идентификация модифицированных искусственным интеллектом фотографий, на которых изображены известные люди , чтобы определить, отражает ли фотография реальную ситуацию.
Предотвращение дезинформации . В контексте борьбы с дезинформацией эффективные детекторы контента ИИ помогают модераторам социальных сетей обнаруживать распространение ложной информации для выявления и устранения повторяющегося контента, созданного ботами.
Ограничение публикации малоценных текстов . Детекторы контента ИИ могут помочь издателям отклонять тексты, содержащие общую информацию, созданную ChatGPT, Bing или Bard, после ввода простого запроса.

Однако стоит помнить, что происхождение текста не является основанием для понижения Google рейтинга сайта. В блоге Центра поиска Google говорится, что для Google важно «вознаграждать качественный контент независимо от того, как он создан […]». Автоматизация уже давно используется для создания полезного контента, такого как спортивные результаты, прогнозы погоды и стенограммы. ИИ может открыть новые уровни самовыражения и творчества и стать ключевым инструментом для создания отличного веб-контента».

Ненадежность детекторов контента AI. Реальность или миф?

Хотя детекторы контента с использованием искусственного интеллекта распространены повсеместно, их эффективность может быть сомнительной. Основные проблемы:

низкая эффективность обнаружения AI-контента,
проблемы с ложными срабатываниями, а также
трудности с адаптацией детекторов к быстрой диверсификации и совершенствованию новых моделей искусственного интеллекта.

Тесты, проведенные OpenAI, показали, что их классификатор распознает текст, сгенерированный GPT, только в 26% случаев. Интересный пример ненадежности генераторов можно увидеть в эксперименте, проведенном TechCrunch, который показал, что инструмент GPTZero правильно идентифицировал пять из семи текстов, сгенерированных ИИ. Пока классификатор OpenAI выявил только один.

Источник: GPTZero (https://gptzero.me/)

Кроме того, существует риск получения ложного срабатывания, то есть идентификации текста, написанного человеком, как сгенерированного ИИ. Например, начало второй главы «Дон Кихота» Мигеля де Сервантеса было помечено детектором OpenAI как, скорее всего, написанное искусственным интеллектом.

Если ошибки в анализе историко-литературных текстов можно рассматривать как забавную курьезность, то ситуация усложняется, когда мы хотим использовать детекторы в качестве инструментов оценки текстов. Конституция США была отмечена ZeroGPT как 92,15% написанная искусственным интеллектом. А согласно исследованию, опубликованному исследователями из Стэнфордского университета, 61% эссе TOEFL, написанных студентами, для которых английский язык не является родным, были классифицированы как сгенерированные искусственным интеллектом. К сожалению, нет данных о том, насколько высок процент текстов, ошибочно отнесенных к положительным на других языках.

Другая проблема – изменение классификации при последующих запусках детектора. Это связано с тем, что часто случается, что детектор, такой как ZeroGPT или Scribbr, меняет классификацию текстовых фрагментов, которые он один раз помечает как сгенерированные ИИ, а другой раз — как написанные человеком.

Источник: Scribbr (https://www.scribbr.com/ai-detector/)

Детекторы изображений и видео ИИ в основном используются для выявления дипфейков и другого контента, созданного ИИ, который может быть использован для распространения дезинформации.

Текущие инструменты обнаружения, такие как Deepware, Illuminarty и FakeCatcher, не предоставляют результатов тестирования их надежности. В юридическом контексте обнаружения визуальных материалов, созданных ИИ, существуют инициативы по добавлению водяных знаков к изображениям ИИ. Однако это очень ненадежный способ – вы запросто можете скачать изображение без водяного знака. Midjourney использует другой подход к нанесению водяных знаков, предоставляя пользователям право решать, хотят ли они наносить водяные знаки на изображение таким способом.

Как избежать обнаружения ИИ. Возможно ли это и как?

Предприниматели должны знать, что детекторы контента с использованием искусственного интеллекта не заменяют человеческую оценку качества и не всегда надежны. Их практические вопросы обслуживания могут вызвать значительные трудности, так же как и попытки избежать классификации вашего контента как созданного искусственным интеллектом. Особенно, когда ИИ — это просто инструмент в руках профессионала, то есть это не «контент, созданный ИИ», а скорее «контент, созданный в сотрудничестве с ИИ».

Добавить кого-то к сгенерированным материалам относительно просто, поэтому способ их создания действительно сложно обнаружить. Если человек, использующий генеративный ИИ, знает, какого эффекта добиться, он может просто вручную настроить результаты.

Основной вопрос заключается в причине нашего желания избежать обнаружения, если контент был создан искусственным интеллектом.

Если это этический вопрос и касается, например, авторства опубликованных научных исследований, то остается полагаться на профессиональную этику ученого и ответственное использование инструментов на базе ИИ.
Если работодатель желает, чтобы сотрудники отказались от использования ИИ, остается договорное соглашение об использовании генеративного искусственного интеллекта.

Это также поднимает вопрос о том, хотим ли мы способствовать ответственному использованию ИИ посредством запретов и недоброжелателей (ZeroGPT и GPTZero!) или посредством признания прозрачности, укрепления доверия и честного использования передовых технологий.

Источник: ZeroGPT (https://www.zerogpt.com/).

Краткое содержание

Ответ на вопрос, стоит ли использовать ИИ-детекторы контента, далеко не однозначен. Детекторы контента с искусственным интеллектом все еще находятся в разработке, и их будущее трудно предсказать. Одно можно сказать наверняка: они будут развиваться вместе с развитием технологий искусственного интеллекта. Достижения в области ИИ, в том числе растущая способность языковых моделей имитировать стиль письма человека, означают, что обнаружение контента ИИ может стать еще более сложным. Для бизнеса это знак следить за этими разработками и полагаться не только на инструменты, но и на свою оценку контента и его пригодности для тех целей, для которых он создан. И разумно использовать стремительно развивающийся искусственный интеллект.

Если вам нравится наш контент, присоединяйтесь к нашему занятому сообществу пчел на Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Автор: Роберт Уитни
Эксперт и инструктор JavaScript, тренирующий ИТ-отделы. Его главная цель — повысить продуктивность команды, обучая других эффективному сотрудничеству при кодировании.
Просмотреть все сообщения

ИИ в бизнесе:

Угрозы и возможности ИИ в бизнесе (часть 1)
Угрозы и возможности ИИ в бизнесе (часть 2)
Приложения искусственного интеллекта в бизнесе – обзор
Текстовые чат-боты с поддержкой искусственного интеллекта
Бизнес НЛП сегодня и завтра
Роль ИИ в принятии бизнес-решений
Планирование публикаций в социальных сетях. Как ИИ может помочь?
Автоматизированные публикации в социальных сетях
Новые сервисы и продукты, работающие с ИИ
Каковы слабые стороны моей бизнес-идеи? Мозговой штурм с ChatGPT
Использование ChatGPT в бизнесе
Синтетические актеры. Топ-3 генератора видео с использованием искусственного интеллекта
3 полезных инструмента графического дизайна с использованием искусственного интеллекта. Генеративный ИИ в бизнесе
3 замечательных автора ИИ, которых вы должны попробовать сегодня
Исследование возможностей искусственного интеллекта в создании музыки
Навигация по новым бизнес-возможностям с помощью ChatGPT-4
Инструменты искусственного интеллекта для менеджера
6 потрясающих плагинов ChatGTP, которые сделают вашу жизнь проще
3 графика А.И. Генерация интеллектуальных технологий для бизнеса
Каково будущее искусственного интеллекта по мнению Глобального института McKinsey?
Искусственный интеллект в бизнесе – Введение
Что такое НЛП, или обработка естественного языка в бизнесе
Автоматическая обработка документов
Google Translate против DeepL. 5 применений машинного перевода для бизнеса
Работа и бизнес-приложения голосовых ботов
Технология виртуального помощника, или как поговорить с ИИ?
Что такое бизнес-аналитика?
Сможет ли искусственный интеллект заменить бизнес-аналитиков?
Как искусственный интеллект может помочь в BPM?
Искусственный интеллект и социальные сети – что они говорят о нас?
Искусственный интеллект в управлении контентом
Творческий ИИ сегодня и завтра
Мультимодальный ИИ и его применение в бизнесе
Новые взаимодействия. Как ИИ меняет то, как мы управляем устройствами?
RPA и API в цифровой компании
Будущий рынок труда и будущие профессии
ИИ в EdTech. 3 примера компаний, которые использовали потенциал искусственного интеллекта
Искусственный интеллект и окружающая среда. 3 решения искусственного интеллекта, которые помогут вам построить устойчивый бизнес
Детекторы контента AI. Стоят ли они того?