A nova ferramenta baseada em inteligência artificial da Google já tem uma versão disponível para programadores e curiosos.
A Google anunciou várias novidades relacionadas com o Gemini, o seu modelo de inteligência artificial proprietário. O grande destaque dessas novidades foi o Gemini 2.0, que se prepara para entrar na era dos “agentes de IA”.
Através de uma longa publicação no blog oficial da Google por parte de Sundar Pichai, CEO da Google e da Alphabet, o responsável assina uma pequena introdução antes de descrever todos os grandes anúncios da empresa, incluindo futuros projetos, ambições e valores para a utilização de ferramentas de inteligência artificial.
“Ao longo do último ano, temos investido no desenvolvimento de modelos mais proativos, ou seja, modelos que conseguem compreender melhor o mundo à tua volta, pensar vários passos à frente e agir em teu nome, com a tua supervisão“, afirma Pichai.
O mais interessante de todos é, no entanto, o anúncio da família de modelos de IA de segunda geração, nomeadamente o Gemini 2.0, que se materializa imediatamente com a chegada de uma primeira versão experimental já disponibilizada para todos: “Hoje estamos entusiasmados por lançar a próxima geração de modelos concebidos para esta nova era proativa: apresentamos o Gemini 2.0, o nosso modelo mais avançado até agora. Com novos avanços na multimodalidade — como saída nativa de imagens e áudio — e utilização nativa de ferramentas, este modelo permitirá criar novos agentes de IA que nos aproximam da nossa visão de um assistente universal.“
Digam “Olá” ao Gemini 2.0 Flash
O Gemini 2.0 Flash é uma nova versão do modelo de inteligência artificial da Google, herdeiro da “antiga” versão 1.5 Flash, que ainda está disponível. A grande vantagem do novo modelo é que oferece um melhor desempenho sem prejudicar os tempos de resposta. De acordo com os dados disponibilizados pela Google, a versão 2.0 Flash apresenta até melhores resultados que o modelo 1.5 Pro nos principais testes de referência.
Para além de suportar entradas multimodais (imagens, vídeo e áudio), o novo modelo também suporta saídas multimodais: é capaz de gerar “nativamente” imagens misturadas com texto e áudio multilingue para síntese de fala.
O Gemini 2.0 Flash já está disponível na versão Web
Após um período de testes internos e com programadores de confiança, a Google decidiu lançar imediatamente o novo Gemini 2.0 Flash para programadores (através de uma API dedicada presente no Google AI Studio e Vertex AI), disponibilizando as primeiras funcionalidades da nova geração (incluindo uma nova API denominada Multimodal Live, que permite explorar diversas potencialidades do modelo, mesmo combinadas, em tempo real).
Já para os consumidores (assinantes avançados e utilizadores padrão), o modelo Gemini 2.0 Flash já está disponível em forma de versão experimental, mas apenas na versão Web do chatbot.
Nos próximos meses, o novo modelo também estará disponível na aplicação móvel do chatbot, enquanto, segundo o que a Google declarou, o potencial do Gemini 2.0 será estendido a outros produtos do ecossistema a partir do início de 2025.