AI multimodal dan aplikasinya dalam bisnis | AI dalam bisnis #21

Diterbitkan: 2022-10-11

Model kecerdasan buatan saat ini yang tersedia untuk bisnis berbeda dari kecerdasan manusia terutama karena kebanyakan unimodal. Ini berarti bahwa mereka hanya menerima satu jenis informasi. Langkah selanjutnya di jalan menuju AI yang sepenuhnya mampu menyangkut model multimodal Mereka menggabungkan berbagai jenis data, dengan cara yang sama, manusia mengembangkan banyak indra untuk menjelajahi dunia tempat mereka tinggal. Tapi aplikasi apa yang dimiliki AI multimodal dalam bisnis?

AI multimodal – daftar isi:

  1. pengantar
  2. AI multimodal hari ini
  3. Gato dan masa depan AI multimodal dalam bisnis
  4. Ringkasan

pengantar

Sebagian besar model kecerdasan buatan saat ini melatih satu jenis data. Ini mungkin termasuk:

  • teks – seperti dalam Natural Language Processing (NLP)
  • gambar – seperti halnya teknologi pengenalan gambar (Computer Vision) yang memungkinkan identifikasi wajah, bentuk, sidik jari, dll.
  • data numerik – untuk analisis data bisnis

Model unimodal seperti itu memproses sejumlah besar informasi dengan cepat dan menemukan pola jauh lebih baik daripada yang dilakukan manusia. Namun, mereka memiliki batasan serius. Mereka tidak peka terhadap konteks, dan tidak terlalu mahir dalam menghadapi situasi yang tidak biasa dan ambigu.

Tugas paling sulit untuk kecerdasan buatan ini ditangani jauh lebih baik oleh model multimodal. Mereka dapat, seperti manusia, menjelajahi dunia dengan "indera" yang berbeda dan belajar dari sumber yang berbeda. Dengan demikian, mereka menghubungkan fakta-fakta yang jauh serta menggabungkan berbagai data bersama-sama.

Dalam konteks bisnis, satu AI multimodal berorientasi masa depan dapat menangani, misalnya, optimalisasi proses bisnis perusahaan, analisis pos media sosial , organisasi logistik, atau bahkan pemosisian fisik barang di gudang. Dengan akses ke berbagai jenis data, dapat mengelola perusahaan secara terpusat, sekaligus memiliki pengetahuan yang luas dan terperinci tentang setiap aspek operasi bisnis yang terukur.

AI multimodal hari ini

Salah satu model kecerdasan buatan yang memanfaatkan multimodalitas adalah DALL-E 2, penulis gambar mengejutkan yang dibuat dari isyarat tekstual. Namun, kemampuan kecerdasan buatan "multi-indera" saat ini jauh melampaui komposisi visual. Model yang dikembangkan saat ini menggabungkan pasangan modalitas seperti:

  • teks dan gambar
  • teks dan audio
  • teks dan video
  • gambar dan model tiga dimensi

Salah satu alat paling menarik yang telah mendapatkan pengakuan adalah Synthesia. Platform berbasis browser untuk membuat video berdasarkan teks yang dimasukkan ini menawarkan presentasi visual disertai dengan avatar-dosen. Synthesia memiliki fitur ekstensif untuk pembuat:

  • presentasi produk
  • manual perangkat lunak dan peralatan teknis
  • materi pelatihan

Sekarang, alih-alih mempekerjakan aktor, pengisi suara, dan desainer presentasi, cukup gunakan layanan AI multimodal untuk bisnis dan buat rekaman berdasarkan teks yang ditulis dengan baik dalam beberapa menit. Dengan menggunakan modul terjemahan, Anda juga akan menyiapkan materi dalam berbagai versi bahasa.

Gato dan masa depan AI multimodal dalam bisnis

Yang terbaik dari model multimodal modern adalah Gato. Jaringan saraf dalam yang dikembangkan oleh Deep Mind ini secara bersamaan memperoleh informasi dari berbagai sumber, belajar lebih cepat dan lebih efisien daripada model unimodal. Beberapa kemampuannya antara lain:

  • mendeskripsikan gambar – mengubah data visual menjadi data tekstual
  • manipulasi objek di ruang fisik – dengan lengan robot yang dilengkapi dengan sensor taktil dan gambar kamera, robot ini melakukan tugas yang berkaitan dengan menata ulang objek
  • menjalankan chatbot berbasis teks – yaitu, melakukan tugas chatbot
  • pemahaman aturan serta pengambilan keputusan dalam permainan

Saat ini, banyak dari fungsi ini sudah ada dalam sistem yang kompleks seperti mobil otonom atau kota pintar . Namun, aplikasi mereka belum ditingkatkan dalam domain bisnis kecil.

Namun, orang dapat membayangkan fungsionalitas multimodal dikirimkan ke berbagai bisnis. Dengan menggambarkan gambar dari kamera CCTV dapat membuat katalog barang inventaris atau mengidentifikasi produk yang hilang di rak-rak toko. Manipulasi objek secara otomatis akan memungkinkan pengisian barang hilang yang diidentifikasi sebelumnya tanpa keterlibatan manusia.

Multimodal AI and its applications in business

Ringkasan

Kecerdasan buatan multimodal telah menimbulkan harapan yang tinggi. Dari sudut pandang kami, ini terutama menandai perubahan revolusioner dalam cara AI bekerja untuk bisnis. Alih-alih didistribusikan, solusi titik untuk mengotomatisasi tugas sederhana dan berulang, munculnya alat yang kuat untuk mengumpulkan data dari berbagai sumber dan menarik kesimpulan dari volume data di luar kemampuan persepsi manusia menjulang di cakrawala.

Mungkin di masa depan, AI bahkan akan membuat perusahaan otonom. Namun lebih cepat, itu akan menghasilkan materi audio-visual waktu nyata yang merespons langsung pertanyaan produk yang dibuat pelanggan.

Jika Anda menyukai konten kami, bergabunglah dengan komunitas lebah sibuk kami di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Multimodal AI and its applications in business | AI in business #21 robert whitney avatar 1background

Pengarang: Robert Whitney

Pakar JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah meningkatkan produktivitas tim dengan mengajari orang lain cara bekerja sama secara efektif saat coding.

AI dalam bisnis:

  1. Kecerdasan buatan dalam bisnis - Pendahuluan
  2. Ancaman dan peluang AI dalam bisnis (bagian 1)
  3. Ancaman dan peluang AI dalam bisnis (bagian 2)
  4. Aplikasi AI dalam bisnis - gambaran umum
  5. Apa itu NLP, atau pemrosesan bahasa alami dalam bisnis?
  6. Pemrosesan dokumen otomatis
  7. AI dan media sosial – apa yang mereka katakan tentang kita?
  8. Penerjemah otomatis. Lokalisasi cerdas produk digital
  9. Chatbot teks berbantuan AI
  10. Operasi dan aplikasi bisnis voicebots
  11. Teknologi asisten virtual, atau bagaimana cara berbicara dengan AI?
  12. Bisnis NLP hari ini dan besok
  13. Bagaimana kecerdasan buatan dapat membantu BPM?
  14. Akankah kecerdasan buatan menggantikan analis bisnis?
  15. Peran AI dalam pengambilan keputusan bisnis
  16. Apa itu Intelijen Bisnis?
  17. Menjadwalkan posting media sosial. Bagaimana AI dapat membantu?
  18. Posting media sosial otomatis
  19. Kecerdasan buatan dalam manajemen konten
  20. AI kreatif hari ini dan besok
  21. AI multimodal dan aplikasinya dalam bisnis
  22. Interaksi baru. Bagaimana AI mengubah cara kita mengoperasikan perangkat?
  23. RPA dan API di perusahaan digital
  24. Layanan dan produk baru yang beroperasi dengan AI
  25. Pasar kerja masa depan dan profesi yang akan datang
  26. AI Hijau dan AI untuk Bumi
  27. EdTech. Kecerdasan buatan dalam pendidikan