O Google lançou nesta quarta-feira (6) o Gemini, modelo de inteligência artificial (IA) que é tratado pela empresa como o mais poderoso já criado por sua equipe. Ele funciona como o “motor” do Bard (concorrente do ChatGPT), mas, por enquanto, está disponível apenas em inglês.
A exemplo do ChatGPT, o Bard é um chatbot (robô conversador): funciona como uma página de bate-papo. Baseado em aprendizado de máquina (“machine learning”, em inglês)., ele é capaz de “imitar” humanos ao fornecer respostas a perguntas feitas pelos usuários.
Para gerar mensagens com as informações solicitadas, essas ferramentas usam uma infinidade de textos disponíveis na internet.
O Gemini também poderá ser usado por outros aplicativos e, na prática, vai competir com ferramentas como o GPT-4, o modelo de IA da OpenAI usado no ChatGPT.
Segundo o Google, o Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história. A empresa também diz que ele se saiu melhor nesse teste do que o GPT-4.
O Google informa que a abordagem para desenvolver o Gemini foi um pouco diferente da adotada em outros modelos de inteligência artificial multimodais, isto é, que conseguem entender ao mesmo tempo diferentes formatos de mensagens, como textos, imagens, áudios e códigos.
Segundo o Google, o Gemini será útil em tarefas que exigem mais capacidade de raciocínio. Ele poderá ser usado tanto para ajudar programadores com códigos complexos quanto estudantes com a lição de casa, por exemplo.
Em uma demonstração divulgada pela empresa, o Gemini serviu para analisar a foto de um exercício de física e identificar um erro no cálculo (veja acima). Graças a essa IA, foi possível encontrar a solução correta. Ela também criou problemas semelhantes para o usuário tentar resolver.
Como o Gemini funciona?
O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google. A ideia é que ele consiga rodar tanto em infraestruturas grandes, como as de data centers, quanto em dispositivos mais limitados, como celulares.
Para atender a esse objetivo, a nova inteligência artificial terá três versões:
Quando ele estará disponível?
O primeiro contato de muitos usuários com o Gemini deverá ser com a versão Pro, que vai melhorar raciocínio, planejamento e compreensão do Bard. A partir desta quarta, o robô do Google já vai usar a nova IA em respostas em inglês (outros idiomas receberão a atualização em breve).
No início de 2024, o Google vai lançar o Bard Advanced, que contará com o Gemini Ultra. Ainda segundo a empresa, nos próximos meses o Gemini se integrará a produtos como Busca e Chrome.
A partir de 13 de dezembro, desenvolvedores e empresas poderão usar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. E o Gemini Ultra vai passar por mais verificações de segurança antes de ser liberado para todos os usuários em 2024.
O que torna o Gemini mais poderoso?
Segundo o Google, a criação de modelos de IA costuma envolver “treinamentos” separados, com foco em cada formato. Em uma segunda etapa, o aprendizado de texto é reunido com o de imagem, por exemplo, e tudo é “empacotado” em apenas um produto.
Na avaliação do Google, esse método permite realizar algumas tarefas, como descrever imagens, mas tem limitações nos casos que exigem mais raciocínio.
“Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, disse Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google.
O Gemini é confiável?
O Google admite que, assim como toda IA, o Gemini está sujeito ao problema de alucinação, um erro que faz a resposta de um robô incluir informações incorretas, tendenciosas ou sem sentido.
A empresa, no entanto, diz que o Gemini é capaz de fazer as melhores avaliações de segurança de uma IA já criada por sua equipe. O objetivo é que ela seja capaz de evitar conteúdo violento ou estereotipado, por exemplo.
A criação do Gemini envolveu ainda o treinamento sobre o que não deve ser exibido aos usuários a partir de um conjunto de 100 mil frases consideradas tóxicas retiradas da internet. Um grupo de especialistas independentes também iniciou os trabalhos para testar os limites da nova IA.
“Estamos abordando esse trabalho com ousadia e responsabilidade”, disse Sundar Pichai, diretor-executivo da Alphabet, controladora do Google.
“Isso significa sermos ambiciosos em nossa pesquisa e buscar capacidades que trarão benefícios enormes para as pessoas e a sociedade, ao mesmo tempo em que construímos salvaguardas e trabalhamos em colaboração com governos e especialistas para enfrentar os riscos à medida que a IA se torna mais capaz”, afirmou ele.
Do g1