AI 개념 증명을 생성하여 AI 개발 및 채택 위험을 최소화하는 방법
게시 됨: 2023-01-19우리 고객은 개념 증명(PoC)으로 시작하기로 선택했기 때문에 인공 지능(AI) 프로젝트에 할당한 예산의 4분의 1만 잃었습니다. PoC를 통해 아이디어를 테스트하고 제한된 지출로 빠르게 실패할 수 있었습니다. 시간과 노력을 낭비하지 않으려면 항상 AI 솔루션 컨설턴트에게 개념 증명을 요청하십시오. 특히 회사에서 AI 솔루션을 테스트하는 경우에는 특히 그렇습니다.
이 기사에서는 AI PoC가 무엇인지 설명하고 그 과정에서 직면할 수 있는 문제와 함께 첫 번째 PoC를 안내하는 5단계에 대해 자세히 설명합니다. 또한 당사 포트폴리오의 AI PoC 예시도 제시합니다. 그리고 첫 단락에 묘사된 예의 해피엔딩을 보게 될 것입니다.
AI PoC란 무엇이며 프로젝트 성공에 필수적인 경우는 언제입니까?
AI PoC는 솔루션이 실현 가능하고 성공할 가능성이 있는지 테스트하기 위해 설계된 제안된 AI 솔루션의 프로토타입 또는 데모입니다. AI PoC를 만드는 목적은 개념을 검증하고, 제안된 솔루션의 잠재적 이점을 평가하고, 잠재적인 문제나 제한 사항을 식별하는 것입니다.
AI PoC에는 일반적으로 제안된 AI 솔루션의 소규모 버전을 구축하고 제어된 환경에서 테스트하여 성능과 원하는 목표를 충족하는지 여부를 확인하는 작업이 포함됩니다. 그런 다음 AI PoC의 결과를 사용하여 솔루션의 개발 및 구현을 추가로 알릴 수 있습니다.
일반 소프트웨어 PoC와 비교하여 AI PoC는 AI 솔루션이 시간이 지남에 따라 학습하고 적응하는 능력, AI 편향과 같은 솔루션의 잠재적인 윤리적 영향과 같은 더 복잡한 고려 사항을 포함할 수 있습니다. AI PoC 프로젝트의 기술 스택도 다릅니다.
기계 학습 알고리즘
이러한 알고리즘을 통해 AI 시스템은 구조화된 데이터에서 학습하고 이러한 학습을 기반으로 예측 또는 결정을 내릴 수 있습니다. 지도 학습 알고리즘, 비지도 학습 알고리즘 및 강화 학습 알고리즘을 포함하여 다양한 유형의 기계 학습 알고리즘이 있습니다.
신경망
이러한 계산 모델은 인간 두뇌의 구조와 기능에서 영감을 받았습니다. 신경망은 대량의 비정형 데이터를 처리하고 분석할 수 있습니다. 이미지 인식, 자연어 처리, 시나리오 모델링, 예측 등 다양한 작업을 수행하도록 훈련할 수 있습니다.
로보틱스
이 기술은 자율 운영 및 의사 결정이 가능한 물리적 시스템을 구축하는 데 사용할 수 있습니다. 로보틱스 솔루션은 엔지니어가 환경과 상호 작용하고 작업을 수행할 수 있는 로봇을 구축할 수 있도록 하는 센서, 액추에이터 및 기타 하드웨어 구성 요소를 통합합니다.
클라우드 컴퓨팅
Microsoft Azure, Google Cloud 및 AWS와 같은 클라우드 컴퓨팅 플랫폼은 AI PoC의 개발 및 테스트를 지원하는 데 필요한 컴퓨팅 성능, 스토리지 리소스 및 사전 구성된 서비스를 제공합니다. 이러한 플랫폼은 개발 및 테스트를 마친 후 AI 솔루션을 호스팅하고 배포할 수도 있습니다.
AI PoC 생성에는 데이터 수집 및 준비, 기계 학습 모델 구축 및 교육, AI 시스템의 성능 테스트 및 평가가 포함됩니다. AI PoC를 만드는 데 걸리는 시간은 제안된 AI 솔루션의 복잡성, PoC에 사용할 수 있는 리소스 및 전문 지식, PoC의 특정 목표를 비롯한 여러 요인에 따라 크게 달라질 수 있습니다. 일부 AI PoC는 며칠 또는 몇 주 만에 개발할 수 있는 반면 다른 PoC는 완료하는 데 몇 달 또는 그 이상이 걸릴 수 있습니다.
AI PoC 주변에 절대 방법이 없는 경우는 언제입니까?
다음 시나리오에서 AI PoC로 프로젝트를 시작하는 것이 필수적입니다.
- 귀하의 프로젝트는 아직 테스트되지 않은 혁신적인 아이디어, 즉 비즈니스 수준에서 연구되었지만 기술적으로 시도되지 않은 혁신적인 아이디어에 의존합니다. 귀하와 귀하의 기술 공급업체 모두 구현 가능 여부를 확신하지 못합니다.
- 제한된 시간 내에 아이디어의 실현 가능성을 이해 관계자, 투자자 및 기타 사람들에게 입증해야 하는 경우. AI PoC는 대화형 프로토타입 또는 이와 유사한 것보다 작업을 더 잘 수행합니다.
AI PoC가 시간 낭비인 상황이 있습니까?
AI PoC는 대부분의 경우에 유용하지만 몇 가지 예외가 있습니다. 프로젝트가 다음 범주 중 하나에 해당하는 경우 AI PoC가 과도할 수 있습니다.
- 귀하의 아이디어와 접근 방식이 기능적 및 기술적 관점에서 매우 잘 문서화되어 있는 경우. 이것은 드물다.
- 개발하려는 솔루션이 표준이고 현장의 일반적인 관행과 유사한 경우. 우리는 이것이 기술적 관점에서 실현 가능하고 가능하다는 것을 이미 알고 있습니다.
- 프런트엔드 및 백엔드 개발자가 이미 동일한 작업을 수행했기 때문에 이해하는 소프트웨어를 빌드하려는 경우.
AI PoC에서 얻을 수 있는 이점은 무엇입니까?
AI PoC를 사용하면 다음과 같은 이점이 있습니다.
- 노력에 더 많은 리소스를 투입하기 전에 잠재적인 문제를 식별합니다. AI PoC를 사용하면 "빠르게 실패하고 더 잘 실패"할 수 있습니다. 팀이 극복할 수 없는 문제에 직면하면 모든 이해 관계자는 다른 방법을 통해 동일한 목표에 도달하기 위해 가설을 재편성하거나 변경할 시간이 있습니다.
- 장기 프로젝트에 뛰어드는 대신 작은 단계로 혁신적인 아이디어를 테스트하여 비즈니스 위험을 최소화합니다.
- 데이터 수집 관행 개선.
- 투자자 및 기타 이해 관계자를 참여시킵니다.
- 시간과 자원을 절약합니다. AI PoC는 비즈니스 또는 프로세스 관련 문제를 발견하고 본격적인 프로젝트를 시작하기 전에 모든 것을 수정할 수 있는 시간을 제공할 수 있습니다.
- 향후 유사한 프로젝트에서 다른 팀원을 멘토링할 전문 지식을 구축하고 지식 소유자를 생성합니다.
- 선택한 비즈니스 사례에 대한 적합성을 이해하기 위해 소규모로 기술 스택을 테스트합니다.
AI PoC가 하루를 구한 우리 포트폴리오의 예
다음은 PoC 접근 방식을 더욱 이해하는 데 도움이 되는 ITRex 포트폴리오의 몇 가지 AI PoC 예입니다.
ML만으로는 답이 아님을 깨닫기
대형 화물 물류 회사는 하루에 10,000~15,000건의 선적을 처리하고 있었고 모든 선적에는 운영을 위한 선하 증권과 송장이 첨부되었습니다. 모든 문서를 수동으로 처리하느라 직원들은 지쳤습니다. 이 회사는 OCR(광학 문자 인식)을 사용하여 스캔한 문서를 처리하고 다양한 필드를 식별하는 ML 기반 솔루션을 구축하고자 했습니다.
클라이언트는 기계 학습이 최상의 솔루션이라고 믿었고, 우리는 이 가정을 테스트하기 위해 AI PoC를 진행했습니다. 곧 우리는 문서의 형식이 다르고 필드에 사용되는 레이블이 상당히 다양하다는 것을 깨달았습니다. 예를 들어 로드 ID 필드에만 별칭이 8개였습니다. 결과적으로 ML 모델은 계속 성장했습니다. 느리고 비효율적이 되었습니다. 우리 팀은 이 모델에 동적 알고리즘(예: 서로 다른 필드 레이블이 하드 코딩된 사전)을 함께 사용하기로 결정했습니다. 이 수정으로 솔루션의 성능이 크게 향상되었고 클라이언트의 시간과 비용이 절약되었습니다.
클라이언트가 AI PoC를 건너뛰기로 결정했다면 순수한 ML 기반 모델에 대한 초기 아이디어가 최적의 솔루션이 아니라는 사실을 깨닫는 데만 7개월을 낭비했을 것입니다. AI PoC를 통해 단 2개월 만에 이러한 결론에 도달했습니다. 이 AI PoC를 성공적으로 완료한 후 수동 처리 부하의 약 25%를 차지하는 4가지 유형의 문서를 처리할 수 있는 MVP를 구축했습니다.
메타의 데이터 사용 제한에 당황
엔터테인먼트 업계의 한 고객은 독립 뮤지컬 연주자를 위한 AI 기반 분석 플랫폼을 구축하기를 원했습니다. 이 솔루션은 데이터를 수집하기 위해 Facebook 및 Instagram을 포함한 소셜 미디어를 크롤링하기로 되어 있었습니다. 이 모든 정보를 처리하여 아티스트에 대한 사람들의 감정을 측정합니다. 뮤지션은 플랫폼에 가입하고 성공에 가장 도움이 되는 소셜 미디어 행동에 대한 피드백을 받을 수 있습니다.
우리는 아이디어를 테스트하기 위해 AI PoC를 진행했습니다. 단 2주 만에 위에서 설명한 목적으로 사용하기 위해 Facebook 및 Instagram에서 데이터를 수집하는 것이 단순히 불가능하다는 것을 깨달았습니다. 일반적으로 일부 데이터는 Graph API를 통해 검색할 수 있었습니다. 이 때문에 Meta에서 확인된 비즈니스 계정뿐만 아니라 필요한 정보에 액세스할 수 있다고 가정했습니다. 그러나 클라이언트는 확인된 비즈니스 계정을 제공할 수 없었고 Graph API의 데이터만으로는 이 솔루션이 작동하기에 충분하지 않았습니다.
고객이 PoC를 건너뛰기로 결정했다면 발견 프로젝트에 약 $20,000를 낭비했을 것입니다. 여기에는 솔루션에 대한 자세한 설명과 개발 비용 추정이 포함되었을 것입니다. 그러나 그들은 AI PoC로 시작하기로 선택했기 때문에 제안된 솔루션이 Meta에 의해 시행되는 데이터 액세스 제한으로 인해 실행이 불가능하다는 것을 파악하기 전에 약 5,000달러만 지출했습니다.
첫 번째 AI PoC를 위한 5단계 가이드
다음은 AI PoC를 성공적으로 통과하기 위해 따를 수 있는 5가지 단계입니다. 또한 각 단계와 관련된 과제도 나열합니다.
1단계: AI로 해결하려는 문제 식별
AI PoC를 구현하여 정확히 무엇을 달성하고자 하는지 지정하는 것이 중요합니다. 선택한 사용 사례는 가치가 높고 이 기술로 가장 잘 해결할 수 있는 것을 나타내야 합니다. 의심이 든다면 시작하기에 좋은 곳은 해당 분야의 다른 사람들이 AI 솔루션을 무엇에 사용하고 있는지 살펴보는 것입니다. 또 다른 방법은 비즈니스가 직면한 문제를 조사하고 AI의 잠재력과 비교하는 것입니다.
기회 목록을 모은 후 다음 질문을 통해 현재 프로젝트에 가장 적합한 질문을 결정할 수 있습니다.
- 해결하려는 문제가 충분히 구체적입니까? 성공을 결정하기 위해 결과를 평가할 수 있습니까?
- 이미 다른 기술로 이 문제를 해결하려고 시도한 적이 있습니까?
- 이 프로젝트를 끝까지 지원할 수 있는 재능과 자금이 있습니까? 사내에 적합한 인재가 없다면 외부 전담팀을 고용할 수 있나요?
- 문제가 비즈니스에 어떤 영향을 미칠까요? 이 효과가 귀하의 노력을 보증할 만큼 충분히 중요합니까?
- 이 프로젝트를 경영진에게 판매할 수 있습니까? 당신의 조직은 그러한 프로젝트를 맡을 준비가 되어 있습니까?
- 귀사는 이미 데이터 전략을 가지고 있습니까? 그렇다면 이 프로젝트와 어떻게 일치할까요?
- 이 문제를 해결하기 위해 AI를 사용하는 것의 잠재적인 위험과 한계는 무엇입니까?
관련 챌린지
- 많은 가치를 추가하지 않거나 AI의 잠재력을 최대한 활용하지 않는 사용 사례를 선택합니다. 인공 지능은 비용이 많이 드는 기술이며 중요하지 않은 경우를 선택하면 받는 것보다 더 많은 비용을 지출하게 됩니다. 비용을 더 잘 이해하려면 AI 구현 비용에 대한 기사를 확인하십시오.
2단계: 데이터 준비
이제 문제를 명확하게 정의했으므로 AI 알고리즘에 대한 교육 데이터를 집계하고 준비할 차례입니다. 다음과 같이 할 수 있습니다.
- 회사 내에서 사용할 수 있는 데이터 확인
- 특정 기성 애플리케이션 또는 자체 솔루션을 사용하여 반합성 데이터 생성
- 신뢰할 수 있는 공급자로부터 데이터 세트 구매
- 오픈 소스 데이터를 사용하여
- 귀하의 목적에 맞는 데이터를 긁어낼 사람을 고용하십시오.
자신을 하나의 출처로 제한할 필요가 없습니다. 위에 나열된 여러 옵션을 조합하여 사용할 수 있습니다.
초기 데이터 스크리닝을 실행하려면 데이터 과학자에게 문의하십시오. 다음 작업을 수행합니다.
- 데이터 구조화
- 소음을 제거하여 청소하십시오
- 표 데이터의 경우 누락된 데이터 요소를 추가합니다.
- 기능 엔지니어링 수행(예: 데이터 필드 추가 및 삭제)
- 데이터 결합 또는 필터링과 같은 조작 적용
데이터 과학자는 추가 데이터를 수집하는 방법이나 기존 데이터 세트로 원하는 결과를 얻을 수 있도록 AI PoC의 범위를 좁히는 방법에 대해 조언할 수 있습니다.
데이터를 사용할 준비가 되면 데이터를 세 세트로 나눕니다.
- 모델이 학습하는 데 사용할 훈련 세트.
- 모델을 검증하고 훈련을 반복하기 위한 검증 세트.
- 알고리즘의 성능을 평가할 테스트 세트.
관련 과제
- 훈련 데이터는 전체 모집단을 대표하지 않습니다. 이 경우 알고리즘은 일반적인 경우에는 잘 수행될 수 있지만 드문 경우에는 좋지 않은 결과를 제공합니다. 예를 들어 X선을 분석하는 의료 ML 모델은 삼출액과 같은 일반적인 장애를 감지하는 데는 탁월할 수 있지만 탈장과 같은 드문 장애를 발견하는 데 어려움을 겪을 것입니다.
- 클래스 불균형, 한 클래스를 나타내는 사례 수가 다른 클래스보다 훨씬 많은 경우(99.9% 대 0.1%의 비율).
- 클래스 혼합과 같은 잘못된 라벨링(예: 자전거를 자동차로 라벨링).
- 훈련 데이터 세트의 높은 잡음.
- 순수한 클래스 분리성을 달성하는 데 어려움이 있습니다. 훈련 세트의 일부 데이터를 특정 클래스로 올바르게 분류할 수 없을 때 발생합니다.
3단계: 솔루션 설계 및 구축 또는 구매
모델을 직접 구축해야 하는지 또는 기존 솔루션을 조달할 수 있는지 궁금할 것입니다. 처음부터 AI 모델을 만드는 것이 이치에 맞는 경우입니다.
- 귀하의 솔루션은 혁신적이며 기존 표준을 준수하지 않습니다.
- 기성품 솔루션은 맞춤화하는 데 비용이 많이 듭니다.
- 가장 가까운 기성품 모델은 과잉이며 실제로 필요한 것보다 훨씬 더 많은 작업을 수행합니다.
모델을 구매하고 맞춤화하는 비용이 처음부터 모델을 구축하는 것보다 적은 경우 기성품 모델을 조달하는 것을 고려하십시오.
AI 알고리즘을 처음부터 구축하기로 결정하면 정확성을 더 잘 제어할 수 있습니다. 작업을 완료하는 데 시간이 더 오래 걸리지만 비즈니스 문제와 내부 프로세스에 맞게 조정됩니다. 외부 소프트웨어를 수용하기 위해 시스템을 변경할 필요가 없습니다.
알고리즘 교육 및 구현을 위한 인프라와 관련하여 로컬 리소스를 사용하는 대신 클라우드에 의존할 수 있습니다. 가장 적합한 것을 결정할 때 고려할 수 있는 네 가지 매개변수가 있습니다.
- 보안. 데이터가 보안과 관련하여 매우 민감한 경우 모든 것을 온프레미스에 유지하는 것이 좋습니다.
- 워크로드. 처리 부하가 다소 무거운 경우 클라우드를 선택하십시오.
- 소송 비용. 비용이 더 많이 드는 항목을 평가하십시오. 리소스를 로컬에서 확보하거나 시간이 지남에 따라 클라우드 사용에 대해 비용을 지불하십시오.
- 접근성. 솔루션을 로컬에서만 사용하려는 경우 사내 서버에 의존할 수 있습니다. 다른 지리적 위치에서 액세스할 수 있어야 하는 경우 클라우드를 고려해 볼 가치가 있습니다.
모든 접근 방식에는 장점과 단점이 있습니다. 의료 부문에서 운영하는 경우 블로그의 의료 게시물의 클라우드 컴퓨팅에 명확하게 설명되어 있습니다. 그렇지 않으면 AI 전문가에게 연락하여 알고리즘 교육을 위한 최고의 기술 스택을 선택하십시오.
관련 과제
- 적절한 훈련 부족. 이로 인해 모델 일반화 가능성이 낮아지는 등의 문제가 발생합니다. 즉, 모델이 교육에서 본 적이 없는 데이터에 대해 정확한 예측을 수행하지 못합니다. 의료 부문의 X선 이미지 분석으로 돌아가서 알고리즘은 최신 스캔으로 캡처한 고품질 이미지를 성공적으로 분석할 수 있지만 구형 기계에서 생성된 스캔에 적용할 때는 여전히 성능이 좋지 않습니다.
- 기존 시스템과의 통합. 그 중 일부는 오래되었거나 독점 기술로 구동될 수 있습니다.
- 적절한 모델 아키텍처를 제시하지 못함(예: 당면한 문제에 대해 올바른 ML 모델을 선택할 수 없음).
- 선택한 아키텍처의 기능이 모델의 요구 사항과 일치하지 않습니다.
- 입력 데이터는 휘발성이므로 모델을 자주 재훈련해야 합니다.
- 모델이 작업을 수행하는 데 필요한 것보다 더 많은 리소스를 사용합니다. 간단한 모델을 실행하기 위해 강력한 서버에 투자할 필요가 없습니다.
4단계: 가치 창출을 위한 AI PoC의 잠재력 평가
이 단계는 AI PoC가 기대에 부응할 수 있는지 평가하는 것입니다. 평가를 수행하는 방법에는 여러 가지가 있습니다.
- 핵심성과지표(KPI)로 돌아가 솔루션을 테스트하십시오. 이러한 요소에는 정확성, 고객 만족도, 속도, 유연성, 공정성 및 안전성이 포함될 수 있습니다.
- AI PoC 배포 전에 시스템이 어떻게 작동했는지에 대한 데이터를 수집합니다. 여기에는 특정 수동 작업에 소요된 시간과 오류 수가 포함될 수 있습니다. 다음으로 이 정보를 사용하여 PoC의 영향을 평가해야 합니다.
- 솔루션의 성능을 이러한 유형의 문제 또는 더 넓은 산업에 대한 벤치마크로 간주되는 다른 제품과 비교하십시오. 예를 들어, 이미지 분류 관련 문제에 대한 벤치마크는 ImageNet과 같은 인기 있는 데이터 세트에 정확한 결과를 제공하는 모델이 될 것입니다.
- 포커스 그룹 또는 온라인 설문 조사를 통해 사용자 피드백을 수집하여 만족 수준을 측정하고 누락된 사항을 확인합니다.
- 비용 편익 분석을 수행하여 이 솔루션이 조직에 미치는 재정적 영향을 이해합니다.
관련 과제
- 평가에서 실수를 합니다. 계산 중 단순한 수학 실수이거나 비즈니스 잠재력을 추정하는 것과 관련된 오류일 수 있습니다.
5단계: 더 나은 결과를 위해 AI PoC에서 반복하거나 확장
이전 단계에서 받은 결과가 동등하지 않은 경우 솔루션을 수정하고 전체 프로세스를 반복하는 것을 고려할 수 있습니다. ML 알고리즘을 변경하고 조정할 때마다 성능을 측정할 수 있습니다. 다른 하드웨어 구성 요소 또는 대체 클라우드 서비스 모델을 실험할 수도 있습니다.
AI PoC의 성능에 만족한다면 다른 방향으로 확장 작업을 할 수 있습니다. 다음은 몇 가지 예입니다.
- 다른 비즈니스 사례에 PoC를 적용합니다. 귀하의 비즈니스 내에서 이 새로운 솔루션의 다른 응용 프로그램을 찾으십시오. 예를 들어 예측 유지 관리의 한 가지 응용 프로그램으로 AI를 테스트하는 경우 다른 관련 시나리오에 적용해 볼 수 있습니다.
- 인프라를 확장합니다. 이 소프트웨어를 실행하는 데 사용되는 기술을 검토하십시오. 더 많은 처리 능력이나 더 많은 데이터 저장 용량을 전용으로 사용할 수 있습니까? 이러한 수정을 통해 더 많은 데이터를 사용하고 대기 시간을 줄이며 실시간으로 결과를 제공할 수 있습니다. 또한 향후 병목 현상의 가능성을 최소화합니다.
- PoC 솔루션을 최적화합니다. 이전 단계에서 합리적인 결과를 얻었더라도 정확도를 개선할 방법을 찾아볼 가치가 있습니다. 새 데이터 또는 더 정확하게 레이블이 지정된 데이터를 사용하여 알고리즘을 계속 훈련할 수 있습니다. 또는 더 나은 결과를 얻기 위해 조정 및 변경을 구현하는 실험을 할 수도 있습니다.
PoC 단계에 따라 전사적으로 AI를 채택하기로 결정한 경우 조직에서 AI를 구현하는 방법에 대한 가이드에서 유용한 팁을 찾을 수 있습니다.
관련 과제
- 아키텍처는 신중하게 고려되지 않았습니다. 이 솔루션은 10,000명의 사용자에게는 잘 작동하지만 청중이 100,000명에 도달하면 충돌이 발생합니다.
- 모델에는 AI 솔루션을 확장하려고 시도할 때 나타나는 버그가 포함되어 있습니다.
- 의도된 비즈니스 사례가 아닌 다른 비즈니스 사례에 모델을 적용합니다. 예를 들어 정원용 외바퀴 손수레를 조립하기 위한 솔루션은 조립 트럭에 적용할 수 없습니다. 모터가 있는 대형 정원용 외바퀴 손수레를 만들 수 있기 때문입니다.
결론적으로
AI 구현에 관해서는 작게 시작하고 관리 가능한 상태를 유지하십시오. 성공을 측정하기 위해 정의된 목표와 지표가 있는 명확한 비즈니스 사례가 있는지 확인하십시오. 그리고 이 문서의 시작 부분에 제시된 사례를 제외하고는 항상 AI PoC 생성을 고려하십시오. 이렇게 하면 완전히 시작하기 전에 잠재적인 장애물을 식별하고 기대에 부응하지 못할 수 있는 솔루션에 막대한 재정적 투자를 할 수 있습니다.
조직에 AI를 구현하고 싶지만 비즈니스 아이디어가 실현 가능한지 확실하지 않습니까? 연락하세요! 우리 팀은 아이디어를 실제로 테스트하기 위해 PoC를 수행하는 데 도움을 줄 것입니다.
원래 2023년 1월 9일 https://itrexgroup.com에 게시되었습니다.