Avanços da Google DeepMind em Modelos de Mundo para Simulações Digitais

A Google DeepMind está avançando significativamente na pesquisa em ambientes simulados, um campo que vem sendo explorado por mais de dez anos. Os esforços da empresa incluem desde o treinamento de agentes para dominar jogos de estratégia em tempo real até o desenvolvimento de ambientes simulados voltados para aprendizagem aberta e robótica. Esse trabalho culminou na criação de modelos de mundo, sistemas de IA que utilizam sua compreensão do ambiente para simular aspectos dele, permitindo que agentes prevejam como um ambiente se desenvolverá e como suas ações impactarão esse cenário.

"Os modelos de mundo são um passo crucial rumo à Inteligência Geral Artificial (AGI) porque possibilitam o treinamento de agentes de IA em um currículo ilimitado de ambientes de simulação ricos", afirmou um porta-voz da DeepMind. No ano passado, a empresa lançou os primeiros modelos de mundo fundacionais, Genie 1 e Genie 2, que possibilitaram a geração de novos ambientes para os agentes. Além disso, continuaram a aprimorar as capacidades de geração de vídeo com os modelos Veo 2 e Veo 3, que demonstram um entendimento profundo da física intuitiva.

A nova versão, Genie 3, representa um marco, sendo o primeiro modelo de mundo a permitir interações em tempo real, além de melhorar a consistência e o realismo em comparação com seu antecessor, o Genie 2. Com a capacidade de gerar mundos dinâmicos que podem ser navegados em tempo real a 24 quadros por segundo, mantendo uma resolução de 720p por alguns minutos, o Genie 3 promete revolucionar a forma como interagimos com simulações digitais. Cada um desses modelos reflete o progresso em diferentes capacidades de simulação de mundo, consolidando a posição da DeepMind na vanguarda dessa tecnologia.