AI multimodal și aplicațiile sale în afaceri | AI în afaceri #21

Publicat: 2022-10-11

Modelele de inteligență artificială de astăzi disponibile pentru afaceri diferă de inteligența umană în primul rând prin faptul că sunt în mare parte unimodale. Aceasta înseamnă că preiau un singur tip de informații. Următorul pas pe calea către IA complet capabilă se referă la modelele multimodale. Ele încorporează diverse tipuri de date, în același mod, oamenii au dezvoltat mai multe simțuri pentru a explora lumea în care trăiesc. Dar ce aplicații are AI multimodal în afaceri?

AI multimodal – cuprins:

  1. Introducere
  2. AI multimodal astăzi
  3. Gato și viitorul AI multimodal în afaceri
  4. rezumat

Introducere

Majoritatea modelelor de inteligență artificială de astăzi se antrenează pe un singur tip de date. Acestea pot include:

  • texte – ca în procesarea limbajului natural (NLP)
  • imagini – cum este cazul tehnologiilor de recunoaștere a imaginilor (Computer Vision) care permit identificarea fețelor, formelor, amprentelor etc.
  • date numerice – pentru analiza datelor de afaceri

Astfel de modele unimodale procesează rapid cantități mari de informații și identifică modelele mult mai bine decât o fac oamenii. Cu toate acestea, au limitări serioase. Sunt insensibili la context și nu sunt foarte abili în a face față situațiilor neobișnuite și ambigue.

Aceste sarcini cele mai dificile pentru inteligența artificială sunt gestionate mult mai bine de modelele multimodale. Ei pot, ca și oamenii, să exploreze lumea cu diferite „simțuri” și să învețe din surse diferite. Procedând astfel, conectează fapte îndepărtate și combină o varietate de date împreună.

Într-un context de afaceri, un AI multimodal orientat spre viitor s-ar putea ocupa, de exemplu, de optimizarea proceselor de afaceri ale unei companii, de analiza postărilor pe rețelele sociale, de organizarea logisticii sau chiar de poziționarea fizică a mărfurilor într-un depozit. Cu acces la diferite tipuri de date, ar putea gestiona compania într-un mod centralizat, având în același timp cunoștințe extinse și detaliate despre fiecare aspect măsurabil al operațiunilor de afaceri.

AI multimodal astăzi

Un model de inteligență artificială care profită de multimodalitate este DALL-E 2, autorul unor imagini surprinzătoare create din indicii textuale. Cu toate acestea, capacitățile inteligenței artificiale „multi-senzoriale” de astăzi depășesc cu mult compunerile vizuale. Modelele dezvoltate astăzi combină perechi de modalități precum:

  • text și imagine
  • text și audio
  • text și video
  • imagine și model tridimensional

Unul dintre cele mai interesante instrumente care au câștigat deja recunoaștere este Synthesia. Această platformă bazată pe browser pentru crearea videoclipurilor pe baza textului introdus oferă o prezentare vizuală însoțită de un avatar-lector. Synthesia are multe caracteristici pentru producătorii de:

  • prezentări de produse
  • manuale de software și echipamente tehnice
  • Materiale de antrenament

Acum, în loc să angajați actori, voce off și designeri de prezentare, utilizați doar serviciile AI multimodale pentru afaceri și creați filmări bazate pe text bine scris în câteva minute. Folosind modulul de traducere, veți pregăti și materiale în versiuni în mai multe limbi.

Gato și viitorul AI multimodal în afaceri

Cel mai bun dintre modelele moderne multimodale este Gato. Această rețea neuronală profundă dezvoltată de Deep Mind dobândește simultan informații din diverse surse, învață mai rapid și mai eficient decât modelele unimodale. Unele dintre capacitățile sale includ:

  • descrierea imaginilor – transformarea datelor vizuale în date textuale
  • manipularea obiectelor din spațiul fizic – printr-un braț robot echipat cu senzori tactili și imagini ale camerei, îndeplinește sarcini legate de rearanjarea obiectelor
  • rularea unui chatbot bazat pe text – adică realizarea sarcinilor chatbot
  • înțelegerea regulilor precum și luarea deciziilor în jocuri

Astăzi, multe dintre aceste funcționalități există deja în sisteme complexe, cum ar fi mașinile autonome sau orașele inteligente . Cu toate acestea, aplicația lor nu a fost încă extinsă în domeniul afacerilor mici.

Totuși, ne putem imagina funcționalități multimodale livrate diferitelor afaceri. Prin descrierea imaginilor de la camerele CCTV poate cataloga bunurile de inventar sau poate identifica produsele lipsă de pe rafturile magazinelor. Manipularea obiectelor va permite automat completarea bunurilor lipsă identificate în prealabil, fără nicio implicare umană.

Multimodal AI and its applications in business

rezumat

Inteligența artificială multimodală a suscitat mari speranțe. Din perspectiva noastră, anunță în primul rând schimbări revoluționare în modul în care AI funcționează pentru afaceri. În loc de soluții punctuale distribuite pentru automatizarea sarcinilor simple și repetitive, la orizont se profilează apariția unor instrumente puternice pentru a colecta date dintr-o varietate de surse și a trage concluzii din volume de date dincolo de capacitățile perceptive umane.

Poate că în viitor, AI va crea chiar și companii autonome. Mai devreme însă, va produce materiale audio-vizuale în timp real, care răspund direct la întrebările despre produse pe care clienții le fac.

Dacă vă place conținutul nostru, alăturați-vă comunității noastre de albine ocupate pe Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Multimodal AI and its applications in business | AI in business #21 robert whitney avatar 1background

Autor: Robert Whitney

Expert JavaScript și instructor care antrenează departamentele IT. Scopul său principal este de a crește productivitatea echipei, învățându-i pe alții cum să coopereze eficient în timp ce codifică.

AI în afaceri:

  1. Inteligența artificială în afaceri - Introducere
  2. Amenințările și oportunitățile AI în afaceri (partea 1)
  3. Amenințările și oportunitățile AI în afaceri (partea 2)
  4. Aplicații AI în afaceri - prezentare generală
  5. Ce este NLP sau procesarea limbajului natural în afaceri
  6. Procesarea automată a documentelor
  7. AI și rețelele sociale – ce spun ei despre noi?
  8. Traducător automat. Localizare inteligentă a produselor digitale
  9. Chatbot text asistați de inteligență artificială
  10. Operarea și aplicațiile de afaceri ale vocii roboților
  11. Tehnologia asistentului virtual sau cum să vorbești cu AI?
  12. Business NLP astăzi și mâine
  13. Cum poate ajuta inteligența artificială cu BPM?
  14. Va înlocui inteligența artificială pe analiștii de afaceri?
  15. Rolul AI în luarea deciziilor în afaceri
  16. Ce este Business Intelligence?
  17. Programarea postărilor pe rețelele sociale. Cum poate ajuta AI?
  18. Postări automate pe rețelele sociale
  19. Inteligența artificială în managementul conținutului
  20. AI creativ de astăzi și de mâine
  21. AI multimodal și aplicațiile sale în afaceri
  22. Interacțiuni noi. Cum schimbă AI modul în care operăm dispozitivele?
  23. RPA și API-uri într-o companie digitală
  24. Servicii și produse noi care operează cu AI
  25. Viitoarea piață a muncii și viitoarele profesii
  26. AI verde și AI pentru Pământ
  27. EdTech. Inteligența artificială în educație