기초 모델이란 무엇이며 AI를 대규모로 구현하는 데 어떻게 도움이 됩니까?
게시 됨: 2023-03-29전 세계의 조직이 오랫동안 AI 투자를 아끼지 않았지만 프로토타입에서 생산에 이르는 인공 지능 프로젝트의 수는 여전히 약 53%로 변동합니다.
전문가들은 다른 사용 사례에서 격리된 AI 개념 증명(PoC)을 확장할 수 있는 기술, 인적 자원 및 도구가 부족하기 때문에 이러한 현상이 자주 발생한다고 생각합니다. 물론 높은 교육 비용으로 인해 AI 모델은 다양한 작업에 따라 구분됩니다.
기초 모델, 즉 숙련된 AI 컨설턴트의 지침에 따라 레이블이 지정되지 않은 방대한 양의 데이터를 사용하도록 훈련된 대규모 기계 학습 모델은 AI 확장성 및 비용이라는 어려운 문제에 대한 궁극적인 해답이 될 수 있습니다.
회사는 이러한 모델을 출발점으로 사용하여 종이 기반 문서를 편집 가능한 텍스트 파일로 변환하는 것부터 소셜 미디어 리뷰에서 고객 감정을 발견하는 것까지 다양한 작업을 향상하거나 자동화할 수 있습니다. 그리고 거기에서 AI 우수성을 기반으로 향후 작업 및 사용 사례에 대한 기본 모델을 조정할 수 있습니다.
기초 모델이란 무엇이며 회사가 AI에서 탁월하도록 어떻게 도울 수 있습니까?
바위 밑에서 살지 않았다면 OpenAI의 ChatGPT에 대해 들어보셨을 것입니다. 이 언어 모델 프로그램은 지도 학습을 사용하여 엄청난 양의 대화 텍스트를 흡수했으며, 미세 조정 단계에서는 RLHF(인간 피드백을 통한 강화 학습) 접근 방식을 사용합니다.
이 생성 AI 솔루션은 1,750억 개의 매개변수에 대한 입력 데이터를 분석하고 서면 언어를 심도 있게 이해할 수 있습니다. 또한 질문에 답하고, 텍스트를 요약 및 번역하고, 주어진 주제에 대한 기사를 작성하고, 코드를 작성하는 등의 작업을 수행할 수 있습니다. ChatGPT에 올바른 프롬프트를 제공하기만 하면 됩니다.
OpenAI의 획기적인 제품은 우리가 알고 있는 AI 애플리케이션 개발을 혁신할 수 있는 기초 모델의 한 예일 뿐입니다.
기반 모델은 우리가 알고 있는 AI 개발을 방해합니다. 별도의 사용 사례를 위해 여러 모델을 교육하는 대신 이제 사전 교육된 AI 솔루션을 활용하여 여러 부서 및 직무에서 작업을 향상하거나 완전히 자동화할 수 있습니다.
ChatGPT와 같은 기본 AI 모델을 사용하면 회사는 더 이상 개선하거나 자동화하려는 모든 작업에 대해 알고리즘을 처음부터 훈련할 필요가 없습니다. 대신 사용 사례에 가장 적합한 기반 모델을 선택하고 달성하려는 특정 목표에 맞게 성능을 미세 조정하기만 하면 됩니다.
기본 모델은 교육 데이터를 얻기가 너무 어렵거나 비용이 많이 드는 산업에 적합합니다. 이러한 산업에는 의료, 생명 과학, 생명 공학 및 제조가 포함됩니다.
어떤 유형의 Foundation AI 모델이 있습니까?
여러 유형의 기본 AI 모델이 비즈니스 애플리케이션에서 일반적으로 사용됩니다.
- 준지도 학습 모델은 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터가 혼합된 데이터 세트에서 훈련됩니다. 목표는 레이블이 지정된 데이터를 사용하여 레이블이 지정되지 않은 데이터에 대한 모델의 성능을 개선하는 것입니다. AI 전문가는 교육 데이터를 얻기 어렵거나 회사에 팔과 다리 비용이 들 때 준지도 학습으로 전환합니다. 예를 들어 다양한 의료 IT 규정이 제정된 의료 환경에서 이러한 일이 발생할 수 있습니다. 준지도 모델의 몇 가지 일반적인 예에는 사전 훈련된 텍스트 문서 및 웹 콘텐츠 분류 알고리즘이 포함됩니다.
- 비지도 학습 모델은 레이블이 지정되지 않은 데이터 세트에서 완전히 학습됩니다. 학습 데이터에서 패턴을 발견하거나 스스로 구조화합니다. 이러한 모델은 무엇보다도 교육 데이터 세트에서 발견한 매개변수를 기반으로 정보를 클러스터로 분할할 수 있습니다. 기계 학습(ML) 엔지니어는 자동 인코더, K-평균, 계층적 클러스터링 및 기타 기술을 사용하여 비지도 기계 학습 솔루션을 만들고 정확도를 향상시킵니다.
- 강화 학습 모델은 특정 교육 없이 환경과 상호 작용합니다. 원하는 결과(예: 개발자가 바라는 예측)를 달성하면 모델이 보상을 받습니다. 반대로 강화 학습 모델은 잘못된 가정을 할 때 불이익을 받습니다. 이 접근 방식을 통해 AI 알고리즘은 감독 및 준감독 알고리즘보다 더 복잡한 결정을 내릴 수 있습니다. 실제 강화 학습의 예로는 AlphaGo와 같은 자율 주행 차량 또는 게임 플레이 AI 프로그램이 있습니다.
- 생성 AI 모델은 훈련받은 데이터와 유사한 새로운 데이터를 생성합니다. 이 데이터에는 텍스트, 이미지, 오디오 클립 및 비디오가 포함될 수 있습니다. 이전 섹션에서 언급한 ChatGPT 솔루션은 이 기본 AI 모델 범주에 속합니다. 생성 AI의 다른 예로는 자연어로 작성된 설명을 기반으로 이미지를 생성하는 DALL-E 2 도구와 텍스트 기반 입력을 사용하여 비디오 콘텐츠를 생성하는 Synthesia.io 비디오 플랫폼이 있습니다.
- 전이 학습 모델은 학습된 작업 이외의 작업을 해결할 수 있습니다. 예를 들어 컴퓨터 비전 엔지니어는 객체 감지를 위해 사전 훈련된 이미지 분류 알고리즘을 활용할 수 있습니다. 또한 고객 감정 분석과 같은 보다 지식 집약적인 작업을 위해 기존 NLP 솔루션을 활용할 수도 있습니다. 일부 인기 있는 사전 훈련된 머신 러닝 솔루션에는 개체 분류 및 이미지 감지를 위한 강력한 모델이 포함된 컴퓨터 비전 라이브러리인 OpenCV와 GPT(Generative Pre-trained Transformer)와 같은 Hugging Face의 Transformers 라이브러리 제품이 포함됩니다. 세대(GPT-3)는 ChatGPT 서비스를 강화합니다.
- 메타 학습 모델은 작업 중심 모델과 달리 말 그대로 배우는 법을 배웁니다. 특정 문제를 해결하기 위해 데이터를 소모하는 대신 이러한 모델은 문제 해결을 위한 일반적인 전략을 개발합니다. 이러한 방식으로 메타 학습 솔루션은 메모리 및 컴퓨팅 성능과 같은 리소스를 보다 효율적으로 사용하면서 새로운 문제에 쉽게 적응할 수 있습니다. ML 전문가는 교육 데이터가 부족하거나 회사에서 비즈니스의 AI 구현에 대한 결정적인 계획이 없을 때 메타 학습을 활용합니다. TensorFlow, PyTorch 및 기타 오픈 소스 기계 학습 라이브러리와 프레임워크는 개발자가 메타 학습 기술을 탐색할 수 있는 도구를 제공합니다. 마지막으로 Google과 같은 클라우드 컴퓨팅 제공업체는 ML 전문가와 초보자가 AutoML을 사용하여 사용자 지정 기계 학습 모델을 교육하도록 돕습니다.
특정 애플리케이션과 보유하고 있는 데이터 유형에 따라 하나의 기본 모델이 다른 것보다 더 적합할 수 있습니다. 귀사는 약간의 조정이 필요한 오픈 소스 솔루션 또는 비즈니스 목표를 충족하는 즉시 사용할 수 있는 타사 제품 중에서 자유롭게 선택할 수 있습니다.
다음 프로젝트에 Foundation AI 모델을 활용해야 하는 3가지 이유
독립 실행형 작업 지향 기계 학습 모델과 비교할 때 기초 모델은 더 적은 데이터와 최소한의 미세 조정으로 신뢰할 수 있는 AI 솔루션을 더 빠르고 저렴하게 만드는 데 도움이 됩니다. 단일 조직이 얻을 수 있는 것보다 더 많은 데이터에 대해 교육을 받으면 기초 모델이 첫날부터 높은 정확도를 보인다는 것은 말할 것도 없습니다.
아래에서 기초 AI 모델의 장점에 대한 요약을 찾을 수 있습니다.
- 기초 모델은 더 적은 자원으로 더 빠르고 저렴하게 AI를 구현하는 데 도움이 됩니다. AI 솔루션을 만들고 배포하려면 상당한 시간과 리소스가 필요합니다. 모든 새 애플리케이션에 대해 레이블이 잘 지정된 별도의 데이터 세트가 필요합니다. 그리고 정보가 없다면 해당 정보를 찾고, 정리하고, 레이블을 지정할 데이터 전문가 팀이 필요합니다. IBM AI의 CTO인 Dakshi Agrawal에 따르면 기반 모델은 주어진 사용 사례에 따라 데이터 라벨링 요구 사항을 10~200배 줄이는 데 도움이 되며 이는 상당한 비용 절감으로 이어집니다. 비즈니스 측면에서는 클라우드 컴퓨팅 비용 증가도 고려해야 합니다. 예를 들어 Google은 DeepMind를 인수하기 위해 수백만 달러를 지출했습니다. 그리고 AI 프로젝트가 야심찬 절반은 아닐 수 있지만 AI 앱을 시작하고 실행하는 데 클라우드 서버 비용만으로 $300,000를 쉽게 지출할 수 있습니다. 제너레이티브 AI 솔루션과 같은 기초 모델을 사용하는 또 다른 이유는 R&D에 많은 투자를 하지 않고도 다양한 개념을 신속하게 프로토타입으로 만들고 테스트할 수 있는 기회입니다.
- 기초 AI 모델을 재사용하여 다양한 애플리케이션을 만들 수 있습니다. 이름에서 알 수 있듯이 AI 기반 모델은 여러 AI 애플리케이션의 기반 역할을 할 수 있습니다. 자동차 운전에 대해 생각해 보십시오. 운전면허증을 취득하면 다른 차량을 구입할 때마다 시험에 합격할 필요가 없습니다. 마찬가지로 더 적은 양의 레이블이 지정된 데이터를 사용하여 도메인별 콘텐츠를 처리하기 위해 텍스트를 요약하는 범용 기반 모델을 교육할 수 있습니다. 그리고 기초 모델에는 "창출" 기능도 있습니다. 즉, 일단 훈련된 모델은 다루지 않아야 하는 문제를 해결하는 방법을 배우거나 훈련 데이터에서 예상치 못한 통찰력을 얻을 수 있습니다.
- Foundation AI 모델은 회사의 지속 가능성 목표를 달성하는 데 도움이 됩니다. 하나의 대규모 기계 학습 모델을 교육하면 평생 동안 자동차 5대를 운행하는 것과 동일한 환경 발자국을 남길 수 있습니다. 이렇게 많은 탄소 발자국은 기업의 66%가 에너지 사용의 효율성을 높이고 있는 반면 다른 기업의 49%는 새로운 기후 친화적인 서비스 및 제품을 개발하고 있다는 사실과 극명한 대조를 이룹니다. 기본 AI 모델을 사용하면 지능형 알고리즘을 더 빠르게 훈련하고 컴퓨팅 리소스를 현명하게 활용할 수 있습니다. 특히 여러 작업을 동시에 실행할 수 있는 하드웨어 병렬성을 활용하는 이러한 모델의 아키텍처 덕분입니다.
"AI의 미래"로 간주되는 기초 모델은 AI를 활용하기 위한 문턱을 낮추고 기업이 다른 사용 사례와 회사 전체에서 모델을 확장하도록 지원함으로써 실패한 AI 개념 증명 주기를 잠재적으로 끝낼 수 있습니다.
그러나 모든 기회에는 도전이 따릅니다.
기초 모델을 사용할 때 고려해야 할 사항
기초 AI 모델의 눈에 띄는 유일한 단점은 일부 작업을 설명하기 어렵다는 것입니다.
대규모 기반 모델은 너무 많은 교육 데이터를 사용할 수 있고 너무 많은 심층 계층을 포함하여 알고리즘이 결론에 도달하는 방법을 결정하기 어려운 경우가 있습니다.
기반 모델의 블랙박스 특성은 사이버 범죄자에게도 백도어를 남깁니다. 해커는 데이터 중독 공격을 시작하고 AI 편견을 도입하여 AI의 윤리적 문제를 더욱 악화시킬 수 있습니다.
기술 기업은 AI 기반 모델 사용을 둘러싼 논란을 피하기 위해 공공 AI 프로젝트를 위한 인프라를 구축하기 위해 정부와 힘을 합쳐야 합니다. AI 공급업체는 또한 사용하는 데이터 세트와 모델을 교육하는 방법을 공개해야 합니다.
Stanford HAI 교수진이자 컴퓨터 과학 교수인 Percy Liang은 최근 Venture Beat와의 인터뷰에서 이렇게 말했습니다. 따라서 커뮤니티로서 우리는 이 기술이 윤리적으로 사회적으로 책임 있는 방식으로 개발되고 배포되도록 지금 행동해야 합니다.”
조직에서 기초 모델을 사용하기 시작하려면 무엇이 필요합니까?
지난 10년 동안 회사가 AI 시스템을 구현하는 데 도움을 준 사람으로서 Itrex 팀은 AI의 변화를 목격하고 있습니다.
단일 도메인에서 특정 작업을 실행하는 시스템은 보다 일반적으로 학습하고 산업 및 사용 사례 전반에서 작동하는 광범위한 AI에 자리를 내줍니다. 레이블이 지정되지 않은 대규모 데이터 세트에서 훈련되고 다양한 애플리케이션에 맞게 미세 조정된 기초 모델이 이러한 변환을 주도하고 있습니다.
회사가 경쟁업체를 뛰어넘고 AI 시스템에서 더 빠르게 ROI를 얻을 준비가 된 경우 기본 모델을 구현하기 위한 높은 수준의 전략이 있습니다.
- 데이터를 수집하고 사전 처리합니다. 첫 번째 단계는 기초 AI 모델에 공급할 데이터를 수집하고 사전 처리하는 것입니다. 이 데이터의 품질과 다양성은 미세 조정된 모델이 정확하고 견고하도록 보장하는 데 중요합니다.
- 기초 모델을 선택하십시오. 많은 사전 훈련된 AI 기반 모델이 시중에 나와 있습니다. 인기 있는 솔루션으로는 BERT, GPT, ResNet 등이 있습니다. 해결하려는 작업과 보유하고 있는 데이터 유형에 따라 올바른 기반 모델을 선택하는 것이 중요합니다.
- 비즈니스 목표에 맞게 모델을 조정하십시오. 기본 모델과 데이터가 준비되면 모델의 매개변수를 특정 작업에 맞게 조정할 수 있습니다. 이 목표를 달성하는 한 가지 방법은 기본 모델의 사전 훈련된 가중치를 시작점으로 사용하고 훈련 데이터를 기반으로 조정하는 전이 학습입니다.
- 모델을 평가합니다. 미세 조정 후에는 모델이 제대로 작동하는지, 추가 조정이 필요한지 확인하는 것이 중요합니다. 기본 모델의 성능을 평가하기 위해 정확도, 정밀도, 재현율 및 F1 점수와 같은 표준 메트릭을 사용할 수 있습니다.
- AI 솔루션을 배포합니다. 미세 조정된 모델의 성능에 만족하면 프로덕션 환경에 배포할 수 있습니다. AI 모델을 배포하기 위한 몇 가지 옵션에는 클라우드 기반 플랫폼, 온프레미스 서버 또는 에지 장치가 포함됩니다.
AI 기반 모델을 구현하려면 기술 전문 지식과 특수 하드웨어 및 소프트웨어에 대한 액세스가 필요하다는 점을 기억하는 것이 중요합니다. 따라서 전문 AI 벤더와 협력하거나 AI 전문가 팀과 상담하여 프로세스가 효과적으로 수행되도록 하는 것이 도움이 될 수 있습니다.
귀하의 AI 요구 사항에 대해 논의하려면 전화를 주십시오! 귀사의 AI 준비 상태를 평가하고, 데이터를 감사하고, 알고리즘 분석을 위해 준비하고, 인공 지능을 시작하기 위한 올바른 기반 모델을 선택합니다!
이 기사는 원래 Itrex 웹 사이트에 게시되었습니다.