O Google recentemente lançou um novo modelo de IA multifuncional e de código aberto, o Gemma 3n. O grande atrativo deste modelo é que ele pode ser executado localmente em smartphones com apenas 2GB de memória, proporcionando aos desenvolvedores uma experiência fluida em aplicativos de IA. O Gemma 3n não só suporta entrada de texto, mas também é compatível com processamento de dados de áudio, imagem e vídeo, permitindo que os usuários tenham acesso a funcionalidades completas de multimodalidade em dispositivos móveis.
Como parte da família de modelos Google Gemma, o conceito de desenvolvimento do Gemma 3n enfatiza a abertura e a personalização. O modelo principal E4B e o modelo secundário E2B, agora oficialmente lançados, podem ser baixados nas plataformas Hugging Face e Kaggle. A estrutura desses modelos é treinada com a tecnologia “MatFormer”, alcançando uma arquitetura semelhante a uma matryoshka russa, onde o E2B atua como uma cópia simplificada do E4B, capaz de operar de forma independente.
O modelo E2B, projetado especificamente para plataformas móveis, possui 5 bilhões de parâmetros e conseguiu reduzir o uso de memória a apenas 2GB. Isso se deve ao seu inovador design de “Per-Layer Embeddings (PLE)”, que alivia significativamente a carga de acesso a dados durante a execução do modelo, permitindo que modelos com alta demanda de memória funcionem de maneira fluída em smartphones.
Vale a pena mencionar que o modelo E4B do Gemma 3n possui 8 bilhões de parâmetros, e testes mostram que seu consumo de memória durante a execução é semelhante ao de modelos tradicionais de 4 bilhões, precisando de apenas 3 GB. Em termos de desempenho, o Gemma 3n E4B supera até o GPT 4.1-nano, além de vencer modelos maiores como o Llama 4 Maverick 17B-128E e o Phi-4.
Atualmente, o Gemma 3n suporta vários ambientes de execução, incluindo Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama e MLX, e os usuários também podem instalar o aplicativo Galeria Google AI Edge em dispositivos móveis como o Pixel 8 Pro para execução local. Além disso, os usuários podem testar suas funcionalidades de chat no Google AI Studio.
O Google, através do Gemma 3n, mostrou a possibilidade de que os modelos de IA não estejam mais limitados pelo hardware. Esse design com download aberto e baixas exigências de memória pode impulsionar a rápida adoção de aplicações de IA multimodal em smartphones e dispositivos da Internet das Coisas.



