Recentemente, o Google lançou o seu novo modelo de IA multimodal de código aberto, o Gemma 3n. O maior destaque desse modelo é que ele pode ser executado localmente em smartphones com apenas 2GB de memória, oferecendo aos desenvolvedores uma experiência de aplicativo de IA fluida. O Gemma 3n não apenas suporta entrada de texto, mas também é compatível com processamento de voz, imagem e vídeo, permitindo que os usuários aproveitem todas as funcionalidades multimodais em dispositivos móveis.
Como parte da família de modelos Google Gemma, o conceito de desenvolvimento do Gemma 3n enfatiza consistentemente a abertura e a personalização. O modelo principal E4B e o modelo secundário E2B, agora lançados oficialmente, podem ser baixados nas plataformas Hugging Face e Kaggle. A arquitetura desses modelos é treinada com a tecnologia “MatFormer”, apresentando uma estrutura semelhante a uma matryoshka russa, onde o E2B funciona como uma versão simplificada do E4B, podendo operar de forma independente.
O modelo E2B, projetado especialmente para plataformas móveis, possui 5 bilhões de parâmetros e conseguiu reduzir o uso de memória para apenas 2GB. Isso se deve ao seu inovador design de “Per-Layer Embeddings (PLE)”, que alivia significativamente a carga de acesso a dados durante a execução do modelo, permitindo que modelos com alta demanda de memória funcionem suavemente em smartphones.
Vale a pena mencionar que o modelo E4B do Gemma 3n possui 8 bilhões de parâmetros, e testes mostram que seu consumo de memória durante a execução é semelhante ao de modelos tradicionais de 4 bilhões, exigindo apenas 3GB. Em termos de desempenho, o Gemma 3n E4B supera até o GPT 4.1-nano, além de vencer modelos maiores como o Llama 4 Maverick 17B-128E e o Phi-4.
Atualmente, o Gemma 3n suporta múltiplos ambientes de execução, incluindo Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama e MLX. Os usuários também podem instalar o aplicativo Galeria Google AI Edge em dispositivos móveis como o Pixel 8 Pro para execução local. Além disso, os usuários podem testar suas funcionalidades de chat no Google AI Studio.
O Google, através do Gemma 3n, demonstrou a possibilidade de modelos de IA que não estão mais limitados por hardware. Este design, que permite downloads abertos e tem baixos requisitos de memória, pode impulsionar a rápida adoção de aplicativos de IA multimodal em smartphones e dispositivos da Internet das Coisas.



