다중 모드 AI 및 비즈니스에서의 응용 | 비즈니스의 AI #21

게시 됨: 2022-10-11

오늘날 비즈니스에 사용할 수 있는 인공 지능 모델은 주로 단일 모드라는 점에서 인간 지능과 다릅니다. 이것은 그들이 한 가지 유형의 정보만 받아들인다는 것을 의미합니다. 완전히 유능한 AI로 가는 길의 다음 단계는 다중 모드 모델에 관한 것입니다. 다양한 유형의 데이터를 통합하는 것과 같은 방식으로 인간은 자신이 살고 있는 세계를 탐색하기 위해 다중 감각을 개발했습니다. 그러나 다중 모드 AI는 비즈니스에서 어떤 응용 프로그램을 가지고 있습니까?

다중 모드 AI – 목차:

  1. 소개
  2. 오늘날의 멀티모달 AI
  3. Gato와 비즈니스에서 멀티모달 AI의 미래
  4. 요약

소개

오늘날 대부분의 인공 지능 모델은 한 가지 유형의 데이터를 학습합니다. 여기에는 다음이 포함될 수 있습니다.

  • 텍스트 – 자연어 처리(NLP)에서와 같이
  • 이미지 – 얼굴, 모양, 지문 등을 식별할 수 있는 이미지 인식 기술(Computer Vision)의 경우와 같습니다.
  • 수치 데이터 – 비즈니스 데이터 분석용

이러한 단일 모드 모델은 많은 양의 정보를 빠르게 처리하고 인간보다 패턴을 훨씬 더 잘 찾아냅니다. 그러나 심각한 한계가 있습니다. 그들은 상황에 둔감하고, 비정상적이고 모호한 상황을 다루는 데 능숙하지 않습니다.

인공 지능을 위한 이러한 가장 어려운 작업은 다중 모드 모델에 의해 훨씬 더 잘 처리됩니다. 그들은 인간처럼 다른 "감각"으로 세상을 탐험하고 다른 출처에서 배울 수 있습니다. 그렇게 함으로써 먼 사실을 연결하고 다양한 데이터를 결합합니다.

비즈니스 맥락에서 하나의 미래 지향적인 다중 모드 AI는 예를 들어 회사의 비즈니스 프로세스 최적화, 소셜 미디어 게시물 분석, 물류 조직 또는 창고에서 상품의 물리적 위치 지정을 처리할 수 있습니다. 다양한 유형의 데이터에 액세스하여 중앙 집중식으로 회사를 관리하는 동시에 비즈니스 운영의 모든 측정 가능한 측면에 대한 광범위하고 상세한 지식을 보유할 수 있습니다.

오늘날의 멀티모달 AI

다중 모드를 활용하는 인공 지능 모델 중 하나는 텍스트 신호에서 생성된 놀라운 이미지의 작성자인 DALL-E 2입니다. 그러나 오늘날의 "다감각" 인공 지능의 기능은 시각적 구성을 훨씬 능가합니다. 오늘날 개발된 모델은 다음과 같은 양식 쌍을 결합합니다.

  • 텍스트와 이미지
  • 텍스트 및 오디오
  • 텍스트 및 비디오
  • 이미지 및 3차원 모델

이미 인정을 받은 가장 흥미로운 도구 중 하나는 Synthesia입니다. 입력된 텍스트를 기반으로 비디오를 생성하기 위한 이 브라우저 기반 플랫폼은 아바타 강사와 함께 시각적 프레젠테이션을 제공합니다. Synthesia는 다음과 같은 제조업체를 위한 광범위한 기능을 제공합니다.

  • 제품 프레젠테이션
  • 소프트웨어 및 기술 장비 설명서
  • 교육 자료

이제 배우, 성우, 프리젠테이션 디자이너를 고용하는 대신 비즈니스용 다중 모드 AI 서비스를 사용 하고 몇 분 안에 잘 작성된 텍스트를 기반으로 푸티지를 생성하십시오. 번역 모듈을 사용하여 여러 언어 버전의 자료도 준비하게 됩니다.

Gato와 비즈니스에서 멀티모달 AI의 미래

현대 멀티모달 모델 중 가장 훌륭한 것은 가토(Gato)입니다. 딥마인드가 개발한 이 딥 뉴럴 네트워크는 다양한 소스에서 동시에 정보를 획득하여 유니모달 모델보다 빠르고 효율적으로 학습합니다. 일부 기능은 다음과 같습니다.

  • 이미지 설명 – 시각적 데이터를 텍스트 데이터로 변환
  • 물리적 공간에서 물체 조작 – 촉각 센서와 카메라 이미지가 장착된 로봇 팔에 의해 물체 재배열과 관련된 작업을 수행합니다.
  • 텍스트 기반 챗봇 실행 – 즉, 챗봇 작업 수행
  • 규칙에 대한 이해 와 게임에서의 의사결정

오늘날 이러한 기능 중 상당수는 자율주행차나 스마트 시티와 같은 복잡한 시스템 에 이미 존재합니다. 그러나 그들의 응용 프로그램은 아직 소규모 비즈니스 도메인에서 확장되지 않았습니다.

그러나 다양한 비즈니스에 제공되는 다중 모드 기능을 상상할 수 있습니다. CCTV 카메라의 이미지를 설명하여 재고 상품의 목록을 작성하거나 매장 선반에서 누락된 제품을 식별할 수 있습니다. 개체 조작을 통해 사람의 개입 없이 사전에 식별된 누락된 상품을 자동으로 보충할 수 있습니다.

Multimodal AI and its applications in business

요약

다중 모드 인공 지능은 높은 희망을 불러 일으켰습니다. 우리의 관점에서 이는 주로 AI가 비즈니스에서 작동하는 방식의 혁신적인 변화를 예고합니다. 단순하고 반복적인 작업을 자동화하는 분산된 포인트 솔루션 대신 다양한 소스에서 데이터를 수집하고 인간의 지각 능력을 넘어선 방대한 양의 데이터에서 결론을 도출하는 강력한 도구의 출현이 다가오고 있습니다.

아마도 미래에는 AI가 자율적인 회사를 만들 수도 있습니다. 그러나 머지 않아 고객의 제품 문의에 직접 응답하는 실시간 시청각 자료를 생산할 것입니다.

콘텐츠가 마음에 들면 Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok에서 바쁜 꿀벌 커뮤니티에 가입하세요.

Multimodal AI and its applications in business | AI in business #21 robert whitney avatar 1background

저자: 로버트 휘트니

IT 부서를 지도하는 JavaScript 전문가이자 강사입니다. 그의 주요 목표는 코딩하는 동안 다른 사람들에게 효과적으로 협력하는 방법을 가르쳐 팀 생산성을 높이는 것입니다.

비즈니스의 AI:

  1. 비즈니스의 인공 지능 - 소개
  2. 비즈니스에서 AI의 위협과 기회(1부)
  3. 비즈니스에서 AI의 위협과 기회(2부)
  4. 비즈니스의 AI 애플리케이션 - 개요
  5. NLP 또는 비즈니스의 자연어 처리란 무엇입니까?
  6. 자동 문서 처리
  7. AI와 소셜 미디어 – 그들은 우리에 대해 무엇이라고 말합니까?
  8. 자동 번역기. 디지털 제품의 지능형 현지화
  9. AI 지원 문자 챗봇
  10. 보이스봇의 운영 및 비즈니스 애플리케이션
  11. 가상 비서 기술 또는 AI와 대화하는 방법?
  12. 비즈니스 NLP의 오늘과 내일
  13. 인공 지능이 BPM을 어떻게 도울 수 있습니까?
  14. 인공 지능이 비즈니스 분석가를 대체할 것인가?
  15. 비즈니스 의사 결정에서 AI의 역할
  16. 비즈니스 인텔리전스란 무엇입니까?
  17. 소셜 미디어 게시물 예약. AI가 어떻게 도움이 될까요?
  18. 자동화된 소셜 미디어 게시물
  19. 콘텐츠 관리의 인공 지능
  20. 오늘과 내일의 크리에이티브 AI
  21. 다중 모드 AI 및 비즈니스에서의 응용
  22. 새로운 상호 작용. AI는 우리가 장치를 작동하는 방식을 어떻게 바꾸고 있습니까?
  23. 디지털 회사의 RPA 및 API
  24. AI로 운영되는 새로운 서비스 및 제품
  25. 미래 직업 시장과 미래 직업
  26. 지구를 위한 그린 AI와 AI
  27. 에드테크. 교육의 인공 지능