Google baru saja meluncurkan model AI sumber terbuka multimodal yang sepenuhnya baru, Gemma 3n. Keunggulan utama dari model ini adalah kemampuannya untuk berjalan secara lokal di ponsel pintar dengan hanya 2GB memori, memberikan pengalaman aplikasi AI yang mulus bagi para pengembang. Gemma 3n tidak hanya mendukung input teks, tetapi juga kompatibel dengan pemrosesan suara, gambar, dan video, memungkinkan pengguna untuk merasakan fungsi multimodal lengkap di perangkat bergerak.
Sebagai bagian dari keluarga model Google Gemma, filosofi pengembangan Gemma 3n selalu menekankan pada keterbukaan dan kemampuan untuk disesuaikan. Model utama E4B dan model anak E2B yang resmi dirilis ini dapat diunduh di platform Hugging Face dan Kaggle. Struktur model ini dilatih menggunakan teknologi “MatFormer”, yang mencapai struktur seperti boneka Rusia, di mana E2B berfungsi sebagai salinan ringkas dari E4B dan dapat beroperasi secara mandiri.
Didesain khusus untuk platform mobile, model E2B memiliki 5B parameter, dan berhasil mengurangi penggunaan memori hingga hanya 2GB, semua ini berkat desain inovatif “Per-Layer Embeddings (PLE)”, yang secara signifikan mengurangi beban akses data saat model dijalankan, sehingga model dengan kebutuhan memori tinggi dapat beroperasi dengan lancar di smartphone.
Yang patut dicatat, model E4B dari Gemma 3n memiliki 8B parameter, dan pengujian menunjukkan bahwa konsumsi memori saat beroperasi hampir setara dengan model tradisional 4B, hanya membutuhkan 3GB. Dari segi performa, Gemma 3n E4B bahkan melampaui GPT 4.1-nano, di samping mengalahkan model-model yang lebih besar seperti Llama 4 Maverick 17B-128E dan Phi-4.
Saat ini, Gemma 3n mendukung berbagai lingkungan eksekusi, termasuk Hugging Face Transformers, llama.cpp, Google AI Edge, Ollama, dan MLX. Pengguna juga dapat menginstal aplikasi Galeri AI Edge Google untuk menjalankan secara lokal melalui perangkat mobile seperti Pixel 8 Pro. Selain itu, pengguna dapat menguji fungsi chat-nya di Google AI Studio.
Google melalui Gemma 3n menunjukkan kemungkinan di mana model AI tidak lagi terbatasi oleh perangkat keras. Desain yang dapat diunduh secara terbuka dan memiliki kebutuhan memori rendah ini dapat mendorong masa depan adopsi cepat aplikasi AI multimodal pada smartphone dan perangkat Internet of Things.



