Um dos melhores recursos anunciados na conferência anual da empresa está finalmente a chegar.
A Google anunciou há instantes que vai começar a disponibilizar, a partir de hoje, algumas das novas funcionalidades mostradas durante o Google I/O. Assim, irá iniciar o rollout do novo modelo de geração de imagens, Imagen 3 que vai passar a estar disponível no Gemini, Gemini Advanced, Business e Enterprise.
A Google atualizou as suas capacidades criativas de geração de imagens e, ao longo dos próximos dias, irá levar o seu modelo de geração de imagens mais recente, o Imagen 3, às aplicações Gemini e expandir a sua disponibilidade para utilizadores em todos os idiomas.
Para quem não sabe ou conhece, o Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Podem até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).
O Imagen 3 chega com funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os princípios de design de produto da Google. Numa vasta gama de benchmarks, a ferramenta mostrou ter um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, foi utilizado o SynthID, a ferramenta para assinalar com marcas de água as imagens geradas por IA.
Os seus princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostariam de mudar e será gerada uma nova imagem.
Imagen 3 finalmente disponível
Ao longo dos próximos dias, a Google também irá começar a disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores do Gemini Advanced, Business e Enterprise, a começar com o inglês. A Google diz ter trabalhado para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.
Com o Imagen 3, forma feitos progressos significativos para proporcionar uma experiência de utilização melhor na geração de imagens de pessoas, não sendo a favor da geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais. É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas a Google promete que irá continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuam a melhorá-lo.
Mas, para estarem entre os primeiros a experimentar estas novas funcionalidades, experimentem hoje mesmo o Gemini Advanced ou inscrevam-se no Gemini for Workspace.