Google Genie — model AI generatif yang menciptakan dunia yang sepenuhnya interaktif dari gambar | AI dalam bisnis #123

Diterbitkan: 2024-05-23

Bayangkan sebuah skenario futuristik di mana sistem kecerdasan buatan yang canggih menghidupkan gambar, foto, atau bahkan sketsa tulisan tangan apa pun, mengubahnya menjadi realitas virtual interaktif yang dapat dimainkan sepenuhnya. Luar biasa, bukan? Padahal teknologinya sudah ada. Namanya Google Genie, dan merupakan terobosan model AI yang dapat mengubah wajah industri game, pelatihan sistem AI, dan bahkan robotika. Ingin tahu detail inovasi sensasional ini? Baca terus.

Google Genie – daftar isi

  1. Apa itu Google Jin?
  2. Mengapa Genie inovatif?
  3. Potensi aplikasi Google Genie
  4. Ringkasan

Apa itu Google Jin?

Google Genie (https://sites.google.com/view/genie-2024/) adalah model dunia dasar yang dikembangkan oleh DeepMind. Ini adalah model AI generatif yang dilatih pada lebih dari 30.000 jam rekaman video game platformer 2D yang tersedia untuk umum. Fitur utamanya adalah kemampuan untuk menghasilkan lingkungan yang sepenuhnya interaktif dan dapat dimainkan langsung dari satu gambar, foto, dan bahkan sketsa yang digambar tangan.

Google Genie

Sumber: Genie: Lingkungan Interaktif Generatif (https://arxiv.org/abs/2402.15391)

Bagaimana ini mungkin? Genie menggunakan teknik pembelajaran tanpa pengawasan dalam proses memperoleh kemampuan mengendalikan lingkungan secara tepat hanya berdasarkan rekaman video. Tidak diperlukan penandaan tindakan manusia. Dengan menggunakan modul pengkodean tindakan khusus, ia menangkap perubahan halus antara bingkai video yang berurutan dan memetakannya ke representasi gerakan internal, seperti melompat atau berbelok ke kiri. Model dinamika kemudian menghasilkan frame berikutnya dalam urutan berdasarkan tindakan yang dikodekan.

Hasilnya, Genie dapat menciptakan lingkungan permainan interaktif yang sepenuhnya dapat dikontrol dari data visual apa pun. Setiap gerakan pemain menghasilkan bingkai baru dan unik secara real-time, menciptakan sesi yang mulus dan dapat dimainkan. Ini adalah inovasi besar yang memungkinkan kita menciptakan seluruh dunia interaktif dari gambar atau teks.

Mengapa Genie inovatif?

Inovasi Genie terletak pada penggabungan beberapa elemen kunci dalam satu model:

  • model video generatif, seperti Phenaki (https://phenaki.video/), TECO (https://wilson1yan.github.io/teco/) atau maskvit (https://arxiv.org/abs/2206.11894), yang dapat memprediksi frame masa depan dari suatu urutan berdasarkan frame input dan teks, tetapi tidak menawarkan kemampuan kontrol aktif,
  • model dunia yang berfokus pada prediksi keadaan lingkungan di masa depan berdasarkan tindakan agen, namun memerlukan data yang disediakan oleh manusia,
  • pembelajaran tanpa pengawasan, yang memungkinkan Genie mempelajari dinamika lingkungan dan ruang tindakan hanya dari data video mentah, tanpa label tindakan manusia.

Meskipun masing-masing area ini telah dieksplorasi sebelumnya, Genie adalah model pertama yang menggabungkannya untuk mempelajari lingkungan yang dapat dikontrol langsung dari rekaman video. Pendekatan yang belum pernah terjadi sebelumnya terhadap model pengajaran tanpa pengawasan manusia adalah inovasi utama Genie. Hal ini membuka pintu untuk menggunakan sejumlah besar video yang tersedia di Internet sebagai sumber pelatihan untuk model AI, dan meruntuhkan hambatan yang terkait dengan terbatasnya ketersediaan data berlabel.

Kombinasi model video generatif, model dunia, dan pembelajaran tanpa pengawasan dalam satu solusi mewakili kemajuan mendasar dalam pengembangan kecerdasan buatan. Genie menunjukkan bahwa sistem AI tingkat lanjut dapat mempelajari perilaku dan lingkungan kompleks langsung dari data tidak terstruktur, tanpa pemberian tag manual. Ini adalah langkah kunci menuju pencapaian Artificial General Intelligence (AGI) yang sesungguhnya.

Google Genie

Sumber: Google Genie (https://sites.google.com/view/genie-2024/)

Potensi aplikasi Google Genie

Kemampuan Google Genie lebih dari sekadar menghasilkan video game. Model AI perintis ini dapat diterapkan di banyak bidang:

  • alat untuk animator – cukup unggah gambar, sketsa, atau deskripsi teks singkat dan Genie akan menghasilkan animasi yang konsisten,
  • sumber daya pelatihan tak terbatas untuk agen AI – dengan kemampuannya untuk melakukan generalisasi ke domain yang benar-benar baru, Genie menawarkan tantangan tak terbatas yang dapat dipelajari oleh sistem AI di masa depan. Kurangnya lingkungan pelatihan yang beragam sejauh ini menjadi salah satu hambatan utama dalam pengembangan agen AI generik.
  • simulasi fisik untuk robotika – penelitian menunjukkan bahwa Genie tidak hanya mampu mengendalikan robot virtual, tetapi juga menyadari sifat fisik benda yang dapat diubah bentuknya. Hal ini dapat berdampak besar pada pengembangan robotika dan simulasi fisik,
  • aplikasi di industri kreatif – Genie dapat memfasilitasi pembuatan instalasi seni interaktif, pameran virtual, atau film. Cukup unggah sketsa dan modelnya akan menghasilkan dunia 3D yang sepenuhnya dapat dikontrol, siap untuk dijelajahi.

Namun, potensi tantangan dan keterbatasan teknologi ini tidak boleh diabaikan. Pada tahap pengembangan saat ini, Genie bekerja paling baik di domain sempit seperti game platform 2D. Peningkatan ke lingkungan 3D yang lebih kompleks memerlukan penelitian dan pengoptimalan tambahan. Selain itu, terdapat risiko bahwa teknologi ini dapat disalahgunakan untuk membuat konten berbahaya atau berbahaya. Oleh karena itu, penting untuk mengembangkan kerangka etika dan hukum yang kuat untuk mengatur pengembangan dan penggunaan model AI tersebut.

Google Genie

Sumber: Google Genie (https://sites.google.com/view/genie-2024/)

Ringkasan

Dengan memungkinkan terciptanya lingkungan yang sepenuhnya interaktif langsung dari data visual, tanpa perlu memberi tag tindakan secara manual, Google Genie mewakili terobosan nyata dalam kecerdasan buatan generatif. Model dunia fundamental ini memberikan kekuatan untuk mengekspresikan citra dalam bentuk realitas virtual yang dapat dieksplorasi dan dikendalikan oleh manusia atau agen AI.

Potensi Genie sangat besar – mulai dari alat untuk pengembang game, sumber data pelatihan AI yang tidak terbatas, hingga simulasi fisik untuk robotika. Ini juga merupakan langkah penting menuju AGI. Seiring dengan terus berkembangnya model seperti Genie, batas antara dunia nyata dan dunia maya menjadi semakin cair.

Google Genie

Jika Anda menyukai konten kami, bergabunglah dengan komunitas lebah kami yang sibuk di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Google Genie — a generative AI model that creates fully interactive worlds from images | AI in business #123 robert whitney avatar 1background

Penulis: Robert Whitney

Pakar JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah meningkatkan produktivitas tim dengan mengajari orang lain cara bekerja sama secara efektif saat membuat kode.

AI dalam bisnis:

  1. Ancaman dan peluang AI dalam bisnis (bagian 1)
  2. Ancaman dan peluang AI dalam bisnis (bagian 2)
  3. Aplikasi AI dalam bisnis - ikhtisar
  4. Chatbot teks yang dibantu AI
  5. Bisnis NLP hari ini dan besok
  6. Peran AI dalam pengambilan keputusan bisnis
  7. Menjadwalkan posting media sosial. Bagaimana AI dapat membantu?
  8. Postingan media sosial otomatis
  9. Layanan dan produk baru yang beroperasi dengan AI
  10. Apa kelemahan ide bisnis saya? Sesi brainstorming dengan ChatGPT
  11. Menggunakan ChatGPT dalam bisnis
  12. Aktor sintetik. 3 generator video AI teratas
  13. 3 alat desain grafis AI yang berguna. AI generatif dalam bisnis
  14. 3 penulis AI hebat yang harus Anda coba hari ini
  15. Menjelajahi kekuatan AI dalam penciptaan musik
  16. Menavigasi peluang bisnis baru dengan ChatGPT-4
  17. Alat AI untuk manajer
  18. 6 plugin ChatGTP mengagumkan yang akan membuat hidup Anda lebih mudah
  19. 3 grafik AI. Menghasilkan kecerdasan dalam bisnis
  20. Bagaimana masa depan AI menurut McKinsey Global Institute?
  21. Kecerdasan buatan dalam bisnis - Pendahuluan
  22. Apa itu NLP, atau pemrosesan bahasa alami dalam bisnis
  23. Pemrosesan dokumen otomatis
  24. Google Terjemahan vs DeepL. 5 aplikasi terjemahan mesin untuk bisnis
  25. Pengoperasian dan aplikasi bisnis voicebots
  26. Teknologi asisten virtual, atau bagaimana cara berbicara dengan AI?
  27. Apa itu Intelijen Bisnis?
  28. Akankah kecerdasan buatan menggantikan analis bisnis?
  29. Bagaimana kecerdasan buatan dapat membantu mengatasi BPM?
  30. AI dan media sosial – apa pendapat mereka tentang kita?
  31. Kecerdasan buatan dalam manajemen konten
  32. AI kreatif hari ini dan masa depan
  33. AI multimodal dan penerapannya dalam bisnis
  34. Interaksi baru. Bagaimana AI mengubah cara kita mengoperasikan perangkat?
  35. RPA dan API di perusahaan digital
  36. Pasar kerja masa depan dan profesi yang akan datang
  37. AI di EdTech. 3 contoh perusahaan yang memanfaatkan potensi kecerdasan buatan
  38. Kecerdasan buatan dan lingkungan. 3 solusi AI untuk membantu Anda membangun bisnis yang berkelanjutan
  39. Detektor konten AI. Apakah itu layak?
  40. ObrolanGPT vs Bard vs Bing. Chatbot AI manakah yang memimpin persaingan?
  41. Apakah chatbot AI merupakan pesaing pencarian Google?
  42. Perintah ChatGPT yang Efektif untuk SDM dan Rekrutmen
  43. Rekayasa yang cepat. Apa yang dilakukan seorang insinyur yang cepat?
  44. Pembuat AI Mockup. 4 alat teratas
  45. AI dan apa lagi? Tren teknologi teratas untuk bisnis pada tahun 2024
  46. AI dan etika bisnis. Mengapa Anda harus berinvestasi pada solusi etis
  47. Meta AI. Apa yang perlu Anda ketahui tentang fitur-fitur yang didukung AI di Facebook dan Instagram?
  48. Regulasi AI. Apa yang perlu Anda ketahui sebagai seorang wirausaha?
  49. 5 penggunaan baru AI dalam bisnis
  50. Produk dan proyek AI - apa bedanya dengan yang lain?
  51. Otomatisasi proses yang dibantu AI. Mulai dari mana?
  52. Bagaimana Anda mencocokkan solusi AI dengan masalah bisnis?
  53. AI sebagai ahli di tim Anda
  54. Tim AI vs. pembagian peran
  55. Bagaimana cara memilih bidang karir di AI?
  56. Apakah selalu ada gunanya menambahkan kecerdasan buatan ke dalam proses pengembangan produk?
  57. AI dalam SDM: Bagaimana otomatisasi perekrutan memengaruhi pengembangan SDM dan tim
  58. 6 alat AI paling menarik di tahun 2023
  59. 6 kecelakaan bisnis terbesar yang disebabkan oleh AI
  60. Bagaimana analisis kematangan AI perusahaan?
  61. AI untuk personalisasi B2B
  62. Kasus penggunaan ChatGPT. 18 contoh cara meningkatkan bisnis Anda dengan ChatGPT pada tahun 2024
  63. Pembelajaran mikro. Cara cepat untuk mendapatkan keterampilan baru
  64. Implementasi AI paling menarik di perusahaan pada tahun 2024
  65. Apa yang dilakukan pakar kecerdasan buatan?
  66. Tantangan apa saja yang ditimbulkan oleh proyek AI?
  67. 8 alat AI teratas untuk bisnis pada tahun 2024
  68. AI dalam CRM. Apa perubahan AI pada alat CRM?
  69. Undang-undang UE AI. Bagaimana Eropa mengatur penggunaan kecerdasan buatan
  70. Sora. Bagaimana video realistis dari OpenAI akan mengubah bisnis?
  71. 7 pembuat situs web AI teratas
  72. Alat tanpa kode dan inovasi AI
  73. Seberapa besar penggunaan AI meningkatkan produktivitas tim Anda?
  74. Bagaimana cara menggunakan ChatGTP untuk riset pasar?
  75. Bagaimana cara memperluas jangkauan kampanye pemasaran AI Anda?
  76. "Kita semua adalah pengembang". Bagaimana pengembang warga dapat membantu perusahaan Anda?
  77. AI dalam transportasi dan logistik
  78. Masalah bisnis apa yang dapat diperbaiki oleh AI?
  79. Kecerdasan buatan di media
  80. AI di bidang perbankan dan keuangan. Stripe, Monzo, dan Grab
  81. AI di industri perjalanan
  82. Bagaimana AI mendorong lahirnya teknologi baru
  83. Revolusi AI di media sosial
  84. AI dalam e-niaga. Ikhtisar para pemimpin global
  85. 4 alat pembuatan gambar AI teratas
  86. 5 alat AI teratas untuk analisis data
  87. Strategi AI di perusahaan Anda - bagaimana cara membangunnya?
  88. Kursus AI terbaik – 6 rekomendasi luar biasa
  89. Mengoptimalkan pendengaran media sosial dengan alat AI
  90. IoT + AI, atau cara mengurangi biaya energi di perusahaan
  91. AI dalam bidang logistik. 5 alat terbaik
  92. Toko GPT – ikhtisar GPT paling menarik untuk bisnis
  93. LLM, GPT, RAG... Apa arti akronim AI?
  94. Robot AI – bisnis masa depan atau masa kini?
  95. Berapa biaya penerapan AI di perusahaan?
  96. Bagaimana AI dapat membantu karir seorang freelancer?
  97. Mengotomatiskan pekerjaan dan meningkatkan produktivitas. Panduan AI untuk freelancer
  98. AI untuk startup – alat terbaik
  99. Membangun situs web dengan AI
  100. OpenAI, Tengah Perjalanan, Antropik, Wajah Memeluk. Siapa siapa di dunia AI?
  101. Sebelas Labs dan apa lagi? Startup AI paling menjanjikan
  102. Data sintetis dan pentingnya bagi pengembangan bisnis Anda
  103. Mesin pencari AI teratas. Di mana mencari alat AI?
  104. Video AI. Generator video AI terbaru
  105. AI untuk manajer. Bagaimana AI dapat mempermudah pekerjaan Anda
  106. Apa yang baru di Google Gemini? Segala sesuatu yang perlu Anda ketahui
  107. AI di Polandia. Perusahaan, rapat, dan konferensi
  108. kalender AI. Bagaimana cara mengoptimalkan waktu Anda di perusahaan?
  109. AI dan masa depan pekerjaan. Bagaimana mempersiapkan bisnis Anda untuk perubahan?
  110. Kloning suara AI untuk bisnis. Bagaimana cara membuat pesan suara yang dipersonalisasi dengan AI?
  111. Pengecekan fakta dan halusinasi AI
  112. AI dalam rekrutmen – mengembangkan materi rekrutmen selangkah demi selangkah
  113. Tengah perjalanan v6. Inovasi dalam pembuatan gambar AI
  114. AI di UKM. Bagaimana UKM dapat bersaing dengan raksasa dengan menggunakan AI?
  115. Bagaimana AI mengubah pemasaran influencer?
  116. Apakah AI benar-benar merupakan ancaman bagi pengembang? Devin dan Microsoft AutoDev
  117. Chatbot AI untuk e-commerce. Studi kasus
  118. Chatbot AI terbaik untuk e-niaga. Platform
  119. Bagaimana cara tetap mengetahui apa yang terjadi di dunia AI?
  120. Menjinakkan AI. Bagaimana cara mengambil langkah pertama untuk menerapkan AI dalam bisnis Anda?
  121. Kebingungan, Bing Copilot, atau You.com? Membandingkan mesin pencari AI
  122. Dunia. Model bahasa inovatif dari Apple?
  123. Pakar AI di Polandia
  124. Google Genie — model AI generatif yang menciptakan dunia yang sepenuhnya interaktif dari gambar