
O Google anunciou uma nova versão da inteligência artificial Gemini: o Gemini 1.5 Flash é mais leve e eficaz para aplicações multimodais, de acordo com a gigante da tecnologia. E esta não é a única novidade do Google I/O 2024, evento realizado a partir desta terça-feira (dia 14/05) nos Estados Unidos.
Numa conversa prévia com jornalistas, da qual eu participei, o CEO Sundar Pichai ressaltou que o Google investe em inteligência artificial há mais de uma década. “Temos muitas oportunidades diante de nós”, disse o executivo num momento em que analistas do mercado se perguntam se a empresa tem condições de competir com o ChatGPT e outras tecnologias recentes.
Gemini 1.5 Flash
O Google I/O 2024 é a prova de que o Google está se movimentando para responder à alta expectativa.Tanto que o Gemini 1.5 Flash e o Gemini 1.5 Pro contam com janela de contexto de 1 milhão de tokens. Este número dá uma dimensão da capacidade de o modelo lidar com prompts e tarefas complexas. A título de comparação, o Claude chega a 200 mil tokens, enquanto o GPT-4 vai a 128 mil tokens e o aplicativo do Gemini, a 32 mil tokens.
Sundar disse que o Gemini 1.5 Pro alcançará a marca de 2 milhões de tokens até o fim do ano. O executivo não especificou uma data.
Os variados modelos são capazes de lidar com tarefas de tradução, diálogo, programação, lógica e escrita. No caso da versão Flash, a proposta é realizar resumos, conversas (como chatbot), legenda de fotos e de vídeos, e extração de longos documentos ou tabelas. “Isso é possível porque treinamos o Flash a partir do Gemini 1.5 Pro pelo processo chamado de distilação”, em que o conhecimento de um modelo maior (professor) é repassado para um modelo menor (aluno) preservando as informações mais importantes.
Os modelos da linha Gemini são proprietários. Isso significa que as empresas e desenvolvedores interessados neles precisam de um acordo com o Google, que normalmente passa pelo uso a partir de APIs num serviço de nuvem. Por sua vez, o Google mantém o Gemma, modelo aberto, nos mesmos moldes do Llama 3 (Meta), Phi-3 (Microsoft) e Grok (X/Twitter).
Nesta terça-feira, o Google revelou a atualização para o Gemma 3, que ganhou uma nova arquitetura. Diz a empresa que o LLM está mais rápido e eficiente. Ele será liberado em vários tamanhos, cujos detalhes não foram inicialmente apresentados.
Imagen 3 e Veo
By Tecnoblog Net.