Google Genie — um modelo generativo de IA que cria mundos totalmente interativos a partir de imagens | IA nos negócios #123

Publicados: 2024-05-23

Imagine um cenário futurista em que um avançado sistema de inteligência artificial dá vida a qualquer imagem, foto ou até mesmo um esboço manuscrito, transformando-o em uma realidade virtual interativa e totalmente jogável. Incrível, certo? E ainda assim a tecnologia já existe. Chama-se Google Genie e é um modelo inovador de IA que pode mudar a face da indústria de jogos, do treinamento de sistemas de IA e até da robótica. Quer conhecer os detalhes dessa inovação sensacional? Leia.

Google Genie – índice

  1. O que é o Google Genie?
  2. Por que o Genie é inovador?
  3. Aplicações potenciais do Google Genie
  4. Resumo

O que é o Google Genie?

Google Genie (https://sites.google.com/view/genie-2024/) é um modelo mundial fundamental desenvolvido pela DeepMind. É um modelo generativo de IA treinado em mais de 30.000 horas de imagens de videogame de plataforma 2D disponíveis publicamente. Sua principal característica é a capacidade de gerar ambientes totalmente interativos e jogáveis ​​diretamente a partir de imagens únicas, fotos e até mesmo esboços feitos à mão.

Google Genie

Fonte: Genie: Ambientes interativos generativos (https://arxiv.org/abs/2402.15391)

Como isso é possível? Genie usa uma técnica de aprendizagem não supervisionada no processo de aquisição da capacidade de controlar com precisão o ambiente com base apenas em imagens de vídeo. Nenhuma marcação de ação humana é necessária. Usando um módulo especial de codificação de ação, ele captura mudanças sutis entre quadros de vídeo sucessivos e os mapeia para representações internas de movimento, como pular ou virar à esquerda. O modelo dinâmico gera então o próximo quadro na sequência com base nas ações codificadas.

Como resultado, o Genie pode criar ambientes de jogos interativos e totalmente controláveis ​​a partir de quaisquer dados visuais. Cada movimento do jogador gera um quadro novo e único em tempo real, criando uma sessão suave e jogável. Esta é uma inovação realmente grande que nos permite criar mundos interativos inteiros a partir de imagens ou texto.

Por que o Genie é inovador?

A inovação do Genie reside na combinação de vários elementos-chave num único modelo:

  • modelos de vídeo generativos, como Phenaki (https://phenaki.video/), TECO (https://wilson1yan.github.io/teco/) ou maskvit (https://arxiv.org/abs/2206.11894), que podem prever quadros futuros de uma sequência com base em quadros de entrada e texto, mas não oferecem recursos de controle ativo,
  • modelos mundiais que se concentram na previsão de estados ambientais futuros com base nas ações de um agente, mas exigindo dados fornecidos por humanos,
  • aprendizagem não supervisionada, que permite ao Genie aprender a dinâmica ambiental e o espaço de ação apenas a partir de dados brutos de vídeo, sem rótulos de ação humana.

Embora cada uma dessas áreas já tenha sido explorada antes, o Genie é o primeiro modelo a combiná-las para aprender ambientes controláveis ​​diretamente a partir de imagens de vídeo. Esta abordagem sem precedentes para modelos de ensino sem supervisão humana é uma inovação fundamental do Genie. Abre a porta à utilização da grande quantidade de vídeos disponíveis na Internet como fonte de formação para modelos de IA e quebra as barreiras associadas à disponibilidade limitada de dados rotulados.

A combinação de modelos de vídeo generativos, modelos de mundo e aprendizagem não supervisionada numa única solução representa um avanço fundamental no desenvolvimento da inteligência artificial. Genie demonstra que sistemas avançados de IA podem aprender comportamentos e ambientes complexos diretamente de dados não estruturados, sem marcação manual. Este é um passo fundamental no caminho para alcançar a verdadeira Inteligência Artificial Geral (AGI).

Google Genie

Fonte: Google Genie (https://sites.google.com/view/genie-2024/)

Aplicações potenciais do Google Genie

As capacidades do Google Genie vão muito além da geração de videogames. Este modelo pioneiro de IA pode encontrar aplicações em muitos campos:

  • ferramenta para animadores – basta fazer upload de uma imagem, esboço ou breve descrição de texto e o Genie irá gerar uma animação consistente,
  • recurso de treinamento ilimitado para agentes de IA – com sua capacidade de generalização para domínios inteiramente novos, o Genie oferece um conjunto infinito de desafios sobre os quais os futuros sistemas de IA podem aprender. A falta de ambientes de formação diversificados tem sido até agora uma das principais barreiras ao desenvolvimento de agentes genéricos de IA,
  • simulações físicas para robótica – pesquisas mostraram que o Genie é capaz não apenas de controlar robôs virtuais, mas também de perceber as propriedades físicas de objetos deformáveis. Isto poderia ter enormes implicações para o desenvolvimento da robótica e das simulações físicas,
  • aplicações nas indústrias criativas – o Genie pode facilitar a criação de instalações artísticas interativas, exposições virtuais ou filmes. Basta fazer upload de um esboço e o modelo gerará um mundo 3D totalmente controlável, pronto para exploração.

No entanto, os potenciais desafios e limitações desta tecnologia não devem ser ignorados. No atual estágio de desenvolvimento, o Genie funciona melhor em domínios restritos, como jogos de plataforma 2D. A expansão para ambientes 3D mais complexos exigirá pesquisa e otimização adicionais. Além disso, existe o risco de que esta tecnologia possa ser utilizada de forma abusiva para criar conteúdos nocivos ou perigosos. É, portanto, fundamental desenvolver um quadro ético e jurídico robusto para governar o desenvolvimento e a utilização de tais modelos de IA.

Google Genie

Fonte: Google Genie (https://sites.google.com/view/genie-2024/)

Resumo

Ao permitir a criação de ambientes totalmente interativos diretamente a partir de dados visuais, sem a necessidade de marcar ações manualmente, o Google Genie representa um verdadeiro avanço em inteligência artificial generativa. Este modelo mundial fundamental dá o poder de expressar imagens na forma de realidades virtuais jogáveis ​​que podem ser exploradas e controladas por um humano ou agente de IA.

O potencial do Genie é enorme – desde ferramentas para desenvolvedores de jogos, até uma fonte ilimitada de dados de treinamento para IA, até simulações físicas para robótica. É também um passo importante no caminho para a AGI. À medida que modelos como o Genie continuam a evoluir, a fronteira entre os mundos real e virtual torna-se mais fluida.

Google Genie

Se você gosta do nosso conteúdo, junte-se à nossa comunidade de abelhas ocupadas no Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Google Genie — a generative AI model that creates fully interactive worlds from images | AI in business #123 robert whitney avatar 1background

Autor: Robert Whitney

Especialista em JavaScript e instrutor que orienta departamentos de TI. Seu principal objetivo é aumentar a produtividade da equipe, ensinando aos outros como cooperar de forma eficaz durante a codificação.

IA nos negócios:

  1. Ameaças e oportunidades da IA ​​nos negócios (parte 1)
  2. Ameaças e oportunidades da IA ​​nos negócios (parte 2)
  3. Aplicações de IA nos negócios – visão geral
  4. Chatbots de texto assistidos por IA
  5. PNL empresarial hoje e amanhã
  6. O papel da IA ​​na tomada de decisões de negócios
  7. Agendamento de postagens nas redes sociais. Como a IA pode ajudar?
  8. Postagens automatizadas em mídias sociais
  9. Novos serviços e produtos operando com IA
  10. Quais são os pontos fracos da minha ideia de negócio? Uma sessão de brainstorming com ChatGPT
  11. Usando ChatGPT nos negócios
  12. Atores sintéticos. Os 3 principais geradores de vídeo de IA
  13. 3 ferramentas úteis de design gráfico de IA. IA generativa nos negócios
  14. 3 incríveis escritores de IA que você deve experimentar hoje
  15. Explorando o poder da IA ​​na criação musical
  16. Navegando em novas oportunidades de negócios com ChatGPT-4
  17. Ferramentas de IA para o gestor
  18. 6 plugins ChatGTP incríveis que tornarão sua vida mais fácil
  19. 3 gráficos AI. Geração de inteligência inteligente para negócios
  20. Qual é o futuro da IA ​​de acordo com o McKinsey Global Institute?
  21. Inteligência artificial nos negócios - Introdução
  22. O que é PNL ou processamento de linguagem natural nos negócios
  23. Processamento automático de documentos
  24. Google Tradutor x DeepL. 5 aplicações da tradução automática para empresas
  25. A operação e aplicações de negócios de voicebots
  26. Tecnologia de assistente virtual ou como falar com IA?
  27. O que é inteligência de negócios?
  28. A inteligência artificial substituirá os analistas de negócios?
  29. Como a inteligência artificial pode ajudar no BPM?
  30. IA e redes sociais – o que dizem sobre nós?
  31. Inteligência artificial no gerenciamento de conteúdo
  32. IA criativa de hoje e de amanhã
  33. IA multimodal e suas aplicações nos negócios
  34. Novas interações. Como a IA está mudando a maneira como operamos os dispositivos?
  35. RPA e APIs em uma empresa digital
  36. O futuro mercado de trabalho e as próximas profissões
  37. IA em EdTech. 3 exemplos de empresas que utilizaram o potencial da inteligência artificial
  38. Inteligência artificial e meio ambiente. 3 soluções de IA para ajudá-lo a construir um negócio sustentável
  39. Detectores de conteúdo de IA. Eles valem a pena?
  40. ChatGPT vs Bardo vs Bing. Qual chatbot de IA está liderando a corrida?
  41. O chatbot AI é um concorrente da pesquisa do Google?
  42. Solicitações eficazes do ChatGPT para RH e recrutamento
  43. Engenharia imediata. O que um engenheiro imediato faz?
  44. Gerador de maquete de IA. 4 principais ferramentas
  45. IA e o que mais? Principais tendências de tecnologia para negócios em 2024
  46. IA e ética empresarial. Por que você deve investir em soluções éticas
  47. Meta IA. O que você deve saber sobre os recursos suportados por IA do Facebook e Instagram?
  48. Regulamentação de IA. O que você precisa saber como empreendedor?
  49. 5 novos usos da IA ​​nos negócios
  50. Produtos e projetos de IA – como eles são diferentes dos outros?
  51. Automação de processos assistida por IA. Onde começar?
  52. Como você combina uma solução de IA com um problema de negócios?
  53. IA como especialista em sua equipe
  54. Equipe de IA vs. divisão de funções
  55. Como escolher uma área de carreira em IA?
  56. Sempre vale a pena adicionar inteligência artificial ao processo de desenvolvimento de produtos?
  57. IA em RH: como a automação do recrutamento afeta o RH e o desenvolvimento da equipe
  58. 6 ferramentas de IA mais interessantes em 2023
  59. 6 maiores percalços empresariais causados ​​pela IA
  60. Qual é a análise de maturidade de IA da empresa?
  61. IA para personalização B2B
  62. Casos de uso do ChatGPT. 18 exemplos de como melhorar seu negócio com ChatGPT em 2024
  63. Microaprendizagem. Uma maneira rápida de obter novas habilidades
  64. As implementações de IA mais interessantes nas empresas em 2024
  65. O que os especialistas em inteligência artificial fazem?
  66. Que desafios o projeto de IA traz?
  67. As 8 principais ferramentas de IA para negócios em 2024
  68. IA em CRM. O que a IA muda nas ferramentas de CRM?
  69. A Lei de IA da UE. Como a Europa regulamenta o uso de inteligência artificial
  70. Sora. Como os vídeos realistas da OpenAI mudarão os negócios?
  71. Os 7 principais construtores de sites de IA
  72. Ferramentas sem código e inovações de IA
  73. Quanto o uso de IA aumenta a produtividade da sua equipe?
  74. Como usar o ChatGTP para pesquisas de mercado?
  75. Como ampliar o alcance de sua campanha de marketing de IA?
  76. “Somos todos desenvolvedores”. Como os desenvolvedores cidadãos podem ajudar sua empresa?
  77. IA em transporte e logística
  78. Quais pontos problemáticos de negócios a IA pode corrigir?
  79. Inteligência artificial na mídia
  80. IA em bancos e finanças. Stripe, Monzo e Grab
  81. IA na indústria de viagens
  82. Como a IA está promovendo o nascimento de novas tecnologias
  83. A revolução da IA ​​nas redes sociais
  84. IA no comércio eletrônico. Visão geral dos líderes globais
  85. Quatro principais ferramentas de criação de imagens de IA
  86. As 5 principais ferramentas de IA para análise de dados
  87. Estratégia de IA na sua empresa – como construí-la?
  88. Melhores cursos de IA – 6 recomendações incríveis
  89. Otimizando a escuta nas redes sociais com ferramentas de IA
  90. IoT + IA, ou como reduzir custos de energia em uma empresa
  91. IA em logística. 5 melhores ferramentas
  92. Loja GPT – uma visão geral dos GPTs mais interessantes para negócios
  93. LLM, GPT, RAG... O que significam as siglas de IA?
  94. Robôs de IA – o futuro ou o presente dos negócios?
  95. Qual é o custo de implementação de IA em uma empresa?
  96. Como a IA pode ajudar na carreira de um freelancer?
  97. Automatizando o trabalho e aumentando a produtividade. Um guia de IA para freelancers
  98. IA para startups – melhores ferramentas
  99. Construindo um site com IA
  100. OpenAI, Midjourney, Antrópico, Hugging Face. Quem é quem no mundo da IA?
  101. Onze laboratórios e o que mais? As startups de IA mais promissoras
  102. Dados sintéticos e sua importância para o desenvolvimento do seu negócio
  103. Principais mecanismos de pesquisa de IA. Onde procurar ferramentas de IA?
  104. IA de vídeo. Os mais recentes geradores de vídeo de IA
  105. IA para gerentes. Como a IA pode facilitar seu trabalho
  106. O que há de novo no Google Gemini? Tudo que você precisa saber
  107. IA na Polônia. Empresas, reuniões e conferências
  108. Calendário de IA. Como otimizar seu tempo em uma empresa?
  109. IA e o futuro do trabalho. Como preparar sua empresa para a mudança?
  110. Clonagem de voz de IA para empresas. Como criar mensagens de voz personalizadas com IA?
  111. Verificação de fatos e alucinações de IA
  112. IA no recrutamento – desenvolvendo materiais de recrutamento passo a passo
  113. Meio da jornada v6. Inovações na geração de imagens de IA
  114. IA nas PME. Como podem as PME competir com os gigantes através da IA?
  115. Como a IA está mudando o marketing de influenciadores?
  116. A IA é realmente uma ameaça para os desenvolvedores? Devin e Microsoft AutoDev
  117. Chatbots de IA para comércio eletrônico. Estudos de caso
  118. Os melhores chatbots de IA para comércio eletrônico. Plataformas
  119. Como ficar por dentro do que está acontecendo no mundo da IA?
  120. Domando a IA. Como dar os primeiros passos para aplicar IA no seu negócio?
  121. Perplexidade, Bing Copilot ou You.com? Comparando mecanismos de pesquisa de IA
  122. Reino. Um modelo de linguagem inovador da Apple?
  123. Especialistas em IA na Polônia
  124. Google Genie — um modelo generativo de IA que cria mundos totalmente interativos a partir de imagens