Оценка стоимости генеративного искусственного интеллекта для его эффективного внедрения в вашей организации
Опубликовано: 2024-01-23Некоторые ключевые моменты о затратах на внедрение генеративного искусственного интеллекта (ИИ).
- Стоимость внедрения генеративного ИИ в бизнесе может варьироваться от нескольких сотен долларов в месяц до 190 000 долларов (и продолжает расти) за индивидуальное решение генеративного ИИ, основанное на точно настроенной модели с открытым исходным кодом.
- Эта разница в стоимости генеративного ИИ обусловлена несколькими факторами, включая задачи, которые вы хотите улучшить, модель, которая лучше всего подходит для этих задач, и выбранный подход к реализации.
- Чтобы оптимизировать связанные с этим расходы, вам необходимо тщательно рассмотреть требования вашего проекта, оценить расходы на локальную и облачную инфраструктуру и выбрать между наймом собственных специалистов по искусственному интеллекту и передачей проекта третьей стороне.
Мы уже рассказывали вам, чем генеративный ИИ (поколение ИИ) отличается от традиционного ИИ. Мы также выделили плюсы и минусы технологии. Консультационная группа ITRex по генеративному искусственному интеллекту также изучила варианты использования искусственного интеллекта в нескольких отраслях, включая здравоохранение, розничную торговлю и цепочки поставок.
Кроме того, мы оценили стоимость создания систем искусственного интеллекта и инфраструктуры, а также увеличили затраты на машинное обучение (ML), рассчитав расходы, связанные с подготовкой обучающих данных, точной настройкой моделей и развертыванием решений на базе машинного обучения.
Теперь пришло время расшифровать стоимость внедрения искусственного интеллекта в бизнес. Этот анализ может оказаться непростым, поскольку нам еще неизвестны особенности вашего проекта. Тем не менее, мы можем использовать наш консалтинговый опыт в области искусственного интеллекта, чтобы изучить цены на его услуги и перечислить ключевые факторы, определяющие стоимость проектов в области искусственного интеллекта. Таким образом, мы предоставим вам знания для принятия обоснованных решений, что потенциально сэкономит вашему бизнесу значительное время и ресурсы в этой быстро развивающейся технологической среде.
Заинтересованы? Тогда давайте погрузимся прямо сейчас!
Факторы, влияющие на стоимость создания искусственного интеллекта: выбор модели и подход к реализации
Размышляя о включении искусственного интеллекта поколения в технологический стек вашей компании, важно учитывать следующее:
- Какие бизнес-задачи вы собираетесь решить с помощью генеративного искусственного интеллекта?
- Какая модель подойдет для этих задач?
В основе генеративных решений искусственного интеллекта лежат базовые модели, то есть большие модели, обученные на огромных объемах данных. По сути, базовые модели служат основой для создания индивидуальных решений для искусственного интеллекта, упрощают процесс разработки и снижают затраты на создание искусственного интеллекта. Их возможности обычно включают обработку естественного языка (NLP), компьютерное зрение (CV) и генерацию контента.
Когнитивные возможности базовых моделей во многом зависят от количества параметров, на которых они обучались. В этом контексте параметры относятся к элементам модели, которые изучаются на основе обучающих данных, таких как веса в нейронной сети. Эти параметры помогают модели принимать решения и прогнозировать. Следующая таблица иллюстрирует корреляцию между количеством параметров — по сути, объемом этих элементов принятия решений — и когнитивными способностями модели.
Однако количество параметров – не единственный фактор, влияющий на возможности моделей фундаментов. Качество и разнообразие обучающих данных не менее важны. Данные обучения — это информация, подаваемая в модель, на которой она учится. Такие данные включают в себя широкий спектр примеров, которые помогают модели понимать и интерпретировать новые данные. Кроме того, решающую роль играют архитектура модели — то есть структурная схема взаимодействия параметров и данных — и эффективность алгоритмов обучения, которые определяют, насколько эффективно модель обучается на основе данных. В результате в некоторых задачах модель с меньшим количеством параметров, но лучшими обучающими данными или более эффективной архитектурой может превзойти более крупную модель.
Выбор базовой модели, которая соответствует вашим ожиданиям относительно стоимости создания искусственного интеллекта
Все существующие модели ИИ поколения можно условно разделить на два типа.
- Модели с закрытым исходным кодом разрабатываются крупными технологическими компаниями, такими как Google, Meta, Microsoft и OpenAI. Их исходный код, архитектура и интерфейсы прикладного программирования (API) могут быть полностью проприетарными или предоставляться третьим лицам (обычно за определенную плату, которая по сути является стоимостью решения поколения ИИ). В некоторых случаях вы можете точно настроить производительность моделей с закрытым исходным кодом, используя свои данные. В этой статье мы будем называть модели с закрытым исходным кодом коммерчески доступными решениями поколения AI. Основным преимуществом таких моделей является то, что они оснащены облачной инфраструктурой и полностью поддерживаются первоначальным разработчиком.
- Модели с открытым исходным кодом имеют исходный код, методы обучения, а иногда даже данные обучения, доступные для публичного использования и модификации. Ваша компания может использовать такие модели «как есть» или переобучить их на собственных данных для достижения большей точности и производительности. Однако для работы модели вам придется настроить локальную или облачную инфраструктуру. Таким образом, стоимость таких моделей искусственного интеллекта поколения будет включать затраты на вычисления и, если вы решите улучшить решение искусственного интеллекта поколения, расходы, связанные с обучением модели.
Подведем итоги. Если ваша компания рассматривает возможность внедрения искусственного интеллекта поколения, есть четыре основных способа сделать это.
- Использование моделей с закрытым исходным кодом без настройки: пионеры поколения ИИ могут интегрировать готовые продукты, такие как ChatGPT OpenAI, Google Bard, Claude и Synthesia, со своими приложениями с помощью API. Процесс интеграции довольно прост, как и ценообразование на генеративный ИИ (подробнее об этом позже). Коммерчески доступные продукты часто обновляются и предоставляют обширную документацию для разработчиков ИИ. Обратная сторона? Ваши возможности настройки будут ограничены, и вы будете сильно зависеть от внешней компании в решении жизненно важных бизнес-задач, таких как обработка запросов в службу поддержки клиентов или создание визуального контента.
- Переобучение коммерчески доступных решений на ваших корпоративных данных. В этом сценарии ваша собственная команда ИИ выберет существующий продукт ИИ поколения, разработанный конкретным поставщиком, например OpenAI, и настроит его, используя ваши собственные данные. Индивидуальные решения искусственного интеллекта позволят лучше понимать вопросы пользователей и давать более точные ответы. Тем не менее, поставщик по-прежнему будет взимать небольшую плату за выполнение ваших запросов, поэтому окончательная стоимость создания ИИ будет включать как эксплуатационные расходы, так и расходы на настройку.
- Использование базовых моделей с открытым исходным кодом «как есть»: ваша компания может выбрать RoBERTa, GPT-2, GPT-Neo или любую другую модель с открытым исходным кодом и применить ее для бизнес-задач, таких как ответы на электронные письма клиентов, без дальнейшего обучения. Однако стоимость создания искусственного интеллекта будет определяться вычислительными ресурсами, потребляемыми моделью. Ваше решение для искусственного интеллекта может работать неэффективно при работе с незнакомыми данными и задачами.
- Переобучение моделей с открытым исходным кодом на ваших данных. В этом случае вам потребуется получить и подготовить конкретные данные для обучения модели искусственного интеллекта, предоставить локальные или облачные серверы для обучения и эксплуатации модели, а также продолжить тонкую настройку и обновление. модель по мере развития ваших задач. Хотя этот индивидуальный подход гарантирует превосходную производительность модели, он также влечет за собой более высокие затраты на создание искусственного интеллекта.
Теперь, когда вы знаете варианты реализации, давайте углубимся в стоимость создания искусственного интеллекта, которую влекут за собой эти варианты.
Анализ цен на ИИ поколения на основе сценария внедрения
Стоимость коммерчески доступных инструментов искусственного интеллекта поколения
Готовые услуги, которые упрощают обработку и создание текста, обычно взимают плату с предприятий в зависимости от количества символов или токенов — т. е. базовых единиц текста, которые могут варьироваться от знаков препинания до слов и других элементов синтаксиса — во входном или выходном тексте. .
Вот как это работает на практике.
- Выставление счетов на основе символов: некоторые решения, такие как инструменты искусственного интеллекта, управляемые Google Vertex AI, выставляют счета пользователям на основе количества символов во входном и выходном тексте. Они считают каждую букву, цифру, пробел и знак препинания символом. Например, цены на генеративный ИИ для модели PaLM 2 for Text, поддерживаемой Vertex, начинаются с 0,0005 доллара США за 1000 символов для входного и выходного текста (оплачивается отдельно).
- Биллинг на основе токенов: более продвинутые инструменты искусственного интеллекта имеют тенденцию разбивать текст на токены, а не на символы. В зависимости от методов обучения и обработки модели токен может быть знаком препинания, словом или частью слова. Например, OpenAI определяет токен как группу примерно из четырех символов. Простое предложение вроде «Том принес Джилл цветы». таким образом, будет состоять из восьми токенов, поскольку слова «принес» и «цветы» немного превышают четырехсимвольный порог. Когда дело доходит до стоимости таких генеративных решений ИИ, она во многом зависит от выбранной вами языковой модели. GPT-4 Turbo от OpenAI, один из самых сложных инструментов на рынке, взимает 0,01 доллара США за 1000 токенов для входного текста и 0,03 доллара США за 1000 токенов для выходного текста. Для GPT-3.5 Turbo, его более старой версии, цены значительно ниже: от 0,001 доллара США за 1000 токенов для входного текста до 0,002 доллара США за 1000 токенов для выходного текста. Следует отметить, что поставщики искусственного интеллекта разных поколений имеют разные представления о символах и токенах. . Чтобы выбрать наиболее экономически эффективный вариант, вам следует изучить их документацию и планы и решить, какой продукт лучше всего соответствует вашим уникальным бизнес-потребностям. Например, если ваши задачи связаны с генерацией текста, а не с анализом, более подходящим будет сервис генеративного искусственного интеллекта с более низкой скоростью вывода.
Между тем, сервисы Gen AI для создания визуального контента, как правило, взимают с пользователей плату за каждое созданное изображение, причем плата зависит от размера и качества изображения. Одно изображение размером 1024 на 1024 пикселей, созданное DALL·E 3 в стандартном качестве, обойдется вам в 0,04 доллара. Для изображений большего размера (1024×1792 пикселей), а также изображений высокой четкости цена может доходить до $0,08–0,12 за штуку.
И не забывайте о платформах искусственного интеллекта «под ключ», таких как Synthesia.io, которые используют более традиционный подход к ценообразованию. Если ваша маркетинговая команда хочет ускорить процесс создания видео, вы можете попробовать этот инструмент всего за 804 доллара в год.
Стоимость настройки коммерчески доступных продуктов Gen AI
Как видно из предыдущего раздела, большинство готовых продуктов Gen AI используют стратегию монетизации с оплатой по мере использования.
Хотя на первый взгляд их модели ценообразования выглядят довольно простыми, может быть сложно предсказать, сколько запросов будут выполнять ваши сотрудники, особенно если вы стремитесь изучить несколько вариантов использования ИИ поколения в различных отделах.
Это приводит к путанице в отношении цен на инструменты искусственного интеллекта поколения и общей стоимости владения, как это было на заре облачных вычислений.
Еще одним недостатком использования коммерческих решений искусственного интеллекта является то, что продуктам общего назначения, таким как ChatGPT, не хватает контекстуальных знаний, таких как знание структуры, продуктов и услуг вашей компании. Это затрудняет дополнение таких операций, как поддержка клиентов и создание отчетов, возможностями искусственного интеллекта, даже если вы освоили оперативное проектирование.
По словам Эрика Ламарра, старшего партнера McKinsey, для решения этой проблемы организациям «необходимо создать среду данных, которую сможет использовать модель». Другими словами, вам придется переобучить коммерчески доступные инструменты искусственного интеллекта нового поколения для работы с вашими корпоративными данными, а также с информацией, полученной из внешних источников через API.
Есть два способа достижения цели и несколько факторов, которые повлияют на стоимость генеративного ИИ в каждом сценарии.
Использование платформ «программное обеспечение как услуга» (SaaS) с возможностями искусственного интеллекта поколения
Многие известные поставщики SaaS, в том числе SAP, TIBCO Spotfire и Salesforce, внедряют генеративные услуги искусственного интеллекта, которые можно точно настроить с использованием данных о клиентах. Salesforce, например, запустила Einstein Copilot, диалогового помощника с искусственным интеллектом, который извлекает собственные данные из облака данных Salesforce для разработки персонализированных ответов на вопросы клиентов. Информация, используемая интеллектуальным помощником, включает разговоры Slack, телеметрию, корпоративный контент и другие структурированные и неструктурированные данные.
Клиенты Salesforce также могут создавать собственные модели искусственного интеллекта, навыки и подсказки с помощью построителя подсказок и построителя моделей Einstein Copilot Studio без использования кода. На данный момент последний инструмент поддерживает большие языковые модели OpenAI (LLM), но есть планы интегрировать продукт с другими сторонними решениями, включая Amazon Bedrock и Vertex AI. Поскольку Einstein Copilot все еще находится на пилотной стадии (без каламбура), информация о ценах на генеративный ИИ еще не обнародована. Однако стоимость генеративного помощника AI Sales GPT, которая в настоящее время составляет 50 долларов США на пользователя в месяц, может дать вам общее представление о том, чего ожидать.
Интеграция вашего корпоративного программного обеспечения с решениями Gen AI через API и переобучение моделей на ваших данных
Чтобы снизить затраты на внедрение искусственного интеллекта поколения, вы можете отказаться от промежуточных инструментов SaaS, объединив свои приложения напрямую с коммерческими решениями искусственного интеллекта поколения на уровне API. Например, если вы хотите наполнить своего чат-бота поддержки клиентов возможностями искусственного интеллекта, вы можете синхронизировать его с одной из моделей OpenAI — например, GPT-3.5 или GPT-4 — с помощью OpenAI API. Далее вам необходимо подготовить данные для машинного обучения, загрузить их в OpenAI и управлять процессом тонкой настройки с помощью инструмента OpenAI CLI и библиотеки Open AI Python. При точной настройке модели с вас будет взиматься плата в размере 0,008 доллара США за 1000 токенов (GPT-3.5). Как только ваша модель будет запущена в производство, ставки ввода и вывода составят 0,003 доллара США за 1000 токенов и 0,006 доллара США за тысячу токенов соответственно. Общая стоимость создания искусственного интеллекта также будет включать затраты на хранение, при условии, что вы решите разместить свои данные на серверах OpenAI. Расходы на хранение данных могут добавить к окончательной оценке 0,2 доллара США за 1 ГБ данных в день. И не забывайте о подготовке данных и точной настройке модели. Если ваш ИТ-отдел не обладает необходимыми навыками, вам придется сотрудничать с надежной компанией, предоставляющей услуги по разработке искусственного интеллекта.
Стоимость использования моделей искусственного интеллекта с открытым исходным кодом «как есть»
Отказ от ответственности: мы не предлагаем вам создавать собственную базовую модель, подобную ChatGPT, с нуля — это предприятие лучше оставить тем, у кого есть существенная поддержка, такая как поддержка OpenAI со стороны Microsoft, чтобы компенсировать их потери в 540 миллионов долларов.
Даже более базовые модели фундаментов, такие как GPT-3, могут потребовать начального обучения и затрат на развертывание, превышающих 4 миллиона долларов. Более того, сложность этих моделей фундаментов в последние годы резко возросла.
ITRex: Пользовательский
Объем вычислительных ресурсов, необходимых для обучения крупных моделей ИИ, удваивается каждые 3,5 месяца. Меняется и сложность моделей фундамента. Например, в 2016 году Берт-Лардж прошел обучение по 340 миллионам параметров. Для сравнения, модель GPT-3 OpenAI была обучена примерно по 175 миллиардам параметров.
Хорошей новостью является то, что базовые модели уже существуют, что позволяет предприятиям относительно легко начать экспериментировать с ними, одновременно оптимизируя затраты на внедрение искусственного интеллекта. По сути, мы могли бы рассматривать базовые модели как набор инструментов для инженеров-программистов ИИ, поскольку они обеспечивают отправную точку для решения сложных проблем, оставляя при этом место для настройки.
ITRex: Пользовательский
Мы могли бы условно разделить существующие модели фундаментов на три категории.
- Языковые модели предназначены для решения задач перевода, генерации текста и ответов на вопросы.
- Модели компьютерного зрения превосходно справляются с классификацией изображений, обнаружением объектов и распознаванием лиц.
- Третья категория — генеративные модели ИИ — создает контент, напоминающий данные, использованные моделью. Этот контент может включать новые изображения, симуляции или, в некоторых случаях, текстовую информацию.
Выбрав модель с открытым исходным кодом, которая лучше всего соответствует вашим потребностям, вы можете интегрировать ее со своим программным обеспечением с помощью API и использовать собственную серверную инфраструктуру.
Этот подход предполагает следующие затраты на генеративный ИИ.
- Затраты на оборудование. Для запуска моделей ИИ, особенно крупных, требуются значительные вычислительные ресурсы. Если в вашей компании нет соответствующего оборудования, вам, возможно, придется инвестировать в мощные графические процессоры или процессоры, что может оказаться дорогостоящим. Если ваша модель относительно небольшая, может подойти высокопроизводительный графический процессор, например NVIDIA RTX 3080 или аналогичный. Стоимость такого графического процессора может варьироваться от 700 до 1500 долларов. Для больших моделей, таких как GPT-2 или аналогичных, вам понадобится несколько высокопроизводительных графических процессоров или даже специализированные ускорители искусственного интеллекта. Например, один графический процессор NVIDIA A100 может стоить от 10 000 до 20 000 долларов. Таким образом, установка с несколькими графическими процессорами может стоить от 30 000 до 50 000 долларов.
- Затраты на облачные вычисления. В качестве альтернативы покупке оборудования вы можете арендовать ресурсы облачных вычислений у таких поставщиков, как Amazon Web Services (AWS), Google Cloud Platform (GCP) или Microsoft Azure. Плата за эти услуги взимается в зависимости от использования, поэтому затраты будут зависеть от того, насколько вы используете их ресурсы с точки зрения вычислительного времени и памяти. Например, экземпляры графического процессора на AWS (например, P3 или P4) могут стоить от 3 до 24 долларов в час, в зависимости от типа экземпляра.
- Электричество и техническое обслуживание. Если вы используете собственное оборудование, вы понесете расходы на электроэнергию для работы машин и, возможно, дополнительных систем охлаждения. Затраты на обслуживание оборудования также могут увеличиться.
- Интеграция и развертывание. Интеграция модели ИИ в существующие системы и ее развертывание (особенно в производственной среде) может потребовать дополнительных усилий по разработке программного обеспечения, что может повлечь за собой трудозатраты. Стоимость аутсорсинга разработки ИИ компании-разработчику программного обеспечения может варьироваться от 50 до 200 долларов в час, а общие затраты варьируются от нескольких тысяч до десятков тысяч долларов.
- Хранение и управление данными. Хранение и управление данными, используемыми моделью, может быть дорогостоящим, особенно при работе с большими наборами данных или при использовании решений для облачного хранения. Для установок на месте стоимость хранения генеративных данных ИИ может варьироваться от 1000 до 10 000 долларов США, в зависимости от размера набора обучающих данных и потребностей в резервировании. Плата за облачные решения для хранения данных, такие как AWS S3, может варьироваться от 0,021 до 0,023 доллара США за ГБ в месяц, с дополнительными расходами на операции и передачу данных.
В конечном счете, сколько может стоить вашей компании принятие базовой модели генеративного ИИ «как есть» и ее развертывание в собственной инфраструктуре. Затраты на генеративный искусственный интеллект могут охватывать следующее.
- Аппаратное обеспечение: 20 000–50 000 долларов США (за пару высокопроизводительных графических процессоров или базовую установку с несколькими графическими процессорами).
- Электричество и техническое обслуживание: около 2000–5000 долларов в год.
- Интеграция и развертывание: 10 000–30 000 долларов США (при средней сложности интеграции).
- Хранение и управление данными: 5 000–15 000 долларов США (в зависимости от размера данных).
Общая стоимость установки и эксплуатации генеративного решения искусственного интеллекта будет включать следующее.
- Затраты на первоначальное развертывание: примерно от 37 000 до 100 000 долларов США (аппаратное обеспечение + первоначальная интеграция и настройка хранилища).
- Регулярные расходы: от 7 000 до 20 000 долларов США (включая расходы на электроэнергию, техническое обслуживание, текущую интеграцию и управление данными).
Эти приблизительные оценки могут значительно варьироваться в зависимости от конкретных требований, местоположения и рыночных условий. Всегда лучше проконсультироваться с профессионалом для более индивидуальной и точной оценки. Кроме того, рекомендуется проверить текущие рыночные цены на оборудование и облачные услуги, чтобы узнать самые актуальные цены.
Стоимость переобучения ИИ-решений с открытым исходным кодом с использованием ваших данных
Если ваша компания думает о корректировке базовой модели с открытым исходным кодом, важно учитывать факторы, которые могут повлиять на стоимость внедрения генеративного ИИ.
К таким факторам относятся следующие.
- Размер модели. Более крупные модели, такие как GPT-3, требуют больше ресурсов для точной настройки и развертывания. В результате стоимость генеративного ИИ увеличивается с увеличением размера и сложности модели. Между тем, более простые модели с открытым исходным кодом, такие как GPT-2, XLNet и StyleGAN2, не могут генерировать контент с таким же уровнем согласованности и актуальности.
- Вычислительные ресурсы. Переобучение базовой модели с использованием данных вашей компании требует значительных вычислительных мощностей. Таким образом, стоимость решения поколения AI зависит от того, используете ли вы собственное оборудование или облачные сервисы, причем цена последних варьируется в зависимости от поставщика облачных услуг и масштаба ваших операций. Если вы выберете более простую модель и развернете ее локально, вам придется потратить 10 000–30 000 долларов США на графические процессоры для точной настройки генеративного решения искусственного интеллекта. При использовании облачных вычислений расходы могут варьироваться от 1 до 10 долларов в час, в зависимости от типа экземпляра. Модели с открытым исходным кодом, подобные GPT-3, требуют более продвинутой настройки графического процессора, стоимость которой превышает 50 000–100 000 долларов. Соответствующие расходы на облачные вычисления могут варьироваться от 10 до 24 долларов в час для высокопроизводительных экземпляров графического процессора.
- Подготовка данных. Процесс сбора, очистки и подготовки данных для точной настройки основных моделей может оказаться ресурсоемким. Таким образом, стоимость внедрения генеративного ИИ будет включать расходы, связанные с хранением, обработкой и, возможно, приобретением наборов обучающих данных, если у вашей компании нет ваших собственных данных или она не может использовать их по соображениям безопасности и конфиденциальности.
- Время и опыт разработки: таланты в области ИИ обходятся недешево. Штатный инженер по искусственному интеллекту в США обойдется вашей компании в 70 000–200 000 долларов в год, плюс найм, заработная плата, социальное обеспечение и другие административные расходы. Вы можете сократить затраты на генеративный искусственный интеллект, сотрудничая с оффшорной компанией по разработке программного обеспечения, имеющей опыт разработки искусственного интеллекта. В зависимости от местоположения почасовая ставка таких компаний может варьироваться от 62 до 95 долларов США для старших специалистов по разработке в ключевых регионах аутсорсинга, таких как Центральная Европа и Латинская Америка.
- Затраты на обслуживание. Вы будете нести единоличную ответственность за обслуживание, обновление и устранение неполадок модели, что требует постоянных усилий и опыта проектирования и эксплуатации машинного обучения (MLOps).
Учитывая упомянутые выше факторы, какова реальная стоимость создания индивидуального генеративного решения ИИ на основе легкодоступной базовой модели? Для предприятия среднего размера, желающего усовершенствовать модель среднего размера, такую как GPT-2, соответствующие затраты на внедрение генеративного ИИ могут охватывать следующее.
- Аппаратное обеспечение: 20 000–30 000 долларов США (при умеренной настройке графического процессора).
- Разработка: Предполагается, что на разработку уйдет 6 месяцев с использованием как собственных, так и сторонних специалистов:
Собственные: $35 000–100 000 (полугодовая зарплата)
Аутсорсинг: 20 000–40 000 долларов США (из расчета 400 часов при средней ставке 75 долларов США в час)
- Подготовка данных: 5 000–20 000 долларов США (в зависимости от размера и сложности данных).
- Техническое обслуживание: 5 000–15 000 долларов США в год (текущие расходы).
Общая стоимость установки и эксплуатации генеративного решения искусственного интеллекта будет включать следующее.
- Первоначальные расходы на развертывание: примерно от 80 000 до 190 000 долларов США (включая затраты на оборудование, разработку и подготовку данных).
- Регулярные расходы: от 5 000 до 15 000 долларов США (техническое обслуживание и текущие расходы).
Фактические затраты на разработку и внедрение Gen AI могут варьироваться в зависимости от конкретных требований проекта, наличия данных для обучения и собственных специалистов по искусственному интеллекту, а также местоположения вашего аутсорсингового партнера. Для получения наиболее точных и актуальных цен рекомендуется напрямую проконсультироваться со специалистами или поставщиками услуг.
Хотя 190 000 долларов за систему искусственного интеллекта поколения могут показаться неоправданно дорогими, стоимость создания решения искусственного интеллекта поколения с использованием базовых моделей с открытым исходным кодом может быть ниже, чем выбор коммерчески доступного инструмента.
До того, как ChatGPT привлек внимание, Latitude, новаторский стартап, ответственный за приключенческую игру на основе искусственного интеллекта под названием AI Dungeon, использовал модель GPT OpenAI для генерации текста.
По мере роста их пользовательской базы росли и счета OpenAI, и расходы на инфраструктуру Amazon. В какой-то момент компания платила 200 000 долларов в месяц в качестве сопутствующих расходов на обработку растущего числа пользовательских запросов.
После перехода на нового поставщика генеративного ИИ компания сократила операционные расходы до 100 000 долларов в месяц и скорректировала свою стратегию монетизации, введя ежемесячную подписку на расширенные функции на базе ИИ.
Поэтому, чтобы выбрать правильный подход к внедрению и одновременно оптимизировать цены на генеративный ИИ, важно заранее тщательно проанализировать требования вашего проекта. И именно поэтому мы всегда призываем наших клиентов начинать свои инициативы по разработке ИИ с этапа открытия.
Что следует учитывать при внедрении Gen AI в бизнесе
Теперь, когда вы знаете, чего ожидать от генеративного ИИ с точки зрения затрат, пришло время поговорить о подводных камнях и соображениях реализации этой технологии.
- Модели Фонда, особенно большие языковые модели, могут галлюцинировать, давая, казалось бы, законные, но совершенно неверные ответы на вопросы пользователей. Ваша компания могла бы избежать этого сценария, улучшив обучающие данные, экспериментируя с различными архитектурами моделей и внедрив эффективные циклы обратной связи с пользователями.
- Решения Gen AI обучаются с использованием огромных объемов данных, которые быстро устаревают. В результате вам придется регулярно переобучать свою модель, что увеличивает стоимость реализации генеративного ИИ.
- Модели Фонда, обученные на конкретных данных, таких как записи электронных медицинских карт (ЭМК), могут с трудом создавать достоверный контент за пределами их непосредственного опыта. С другой стороны, модели общего назначения плохо справляются с запросами пользователей, специфичными для предметной области. Некоторые способы решения этой проблемы включают создание гибридных моделей, использование методов трансферного обучения и тонкую настройку моделей на основе отзывов пользователей.
- Решения Gen AI по своей природе являются «черным ящиком», а это означает, что редко бывает ясно, почему они дают определенные результаты и как оценить их точность. Это отсутствие понимания может помешать разработчикам настраивать модели. Следуя объяснимым принципам ИИ во время обучения модели ИИ поколения, например, внедряя методы интерпретации модели, механизмы внимания и контрольные журналы, вы можете получить представление о процессе принятия решений модели и оптимизировать ее производительность.
Кроме того, есть несколько вопросов, на которые ваша компания должна ответить, прежде чем приступить к внедрению генеративного ИИ.
- Существует ли надежная стратегия покупки или сборки, позволяющая убедиться, что ваша компания применяет искусственный интеллект поколения только в тех функциях, где технология станет отличительной чертой, предотвращая при этом привязку к поставщику? Эта стратегия должна быть дополнена подробной дорожной картой по управлению изменениями и масштабированию генерации искусственного интеллекта, а также положениями по перепроектированию всех бизнес-процессов, если возникнет такая необходимость.
- Обладает ли ваш собственный ИТ-отдел адекватными навыками MLOps для тестирования, точной настройки и поддержания качества сложных моделей машинного обучения и данных их обучения? Если нет, то выбрали ли вы уже надежную компанию по разработке искусственного интеллекта, которая возьмет на себя решение этих задач?
- Есть ли у вас значительный объем вычислительных ресурсов как в облаке, так и на периферии? Кроме того, важно оценить масштабируемость вашей ИТ-инфраструктуры, а также возможность повторного использования моделей искусственного интеллекта поколения для различных задач, процессов и подразделений.
- Есть ли у вашей компании или вашего партнера по разработке ИИ навыки для проверки осуществимости создания искусственного интеллекта посредством проверки концепции (PoC) и масштабирования ваших экспериментов за пределами контролируемой среды «песочницы»?
- И последнее, но не менее важное: есть ли в вашей организации эффективные механизмы конфиденциальности и безопасности для защиты конфиденциальной информации и обеспечения соответствия отраслевым и региональным нормам?
Наличие хорошо продуманного плана внедрения не только поможет вам без риска внедрить технологию и быстрее получить выгоду, но и снизить затраты на создание искусственного интеллекта.
Воспользуйтесь консультационными услугами ITRex gen AI, чтобы выяснить, поможет ли gen AI модернизировать бизнес-процессы, выбрать правильный подход к внедрению ИИ поколения и оптимизировать затраты на ИИ поколения. Напишите нам, чтобы начать работу!
Эта статья была первоначально опубликована на веб-сайте ITRex.