Perusahaan teknologi China, DeepSeek, baru saja meluncurkan model v3 mereka, yang tanpa ragu merupakan salah satu model AI open-source paling menjanjikan di tahun ini. Peluncuran inovatif ini telah mencuri perhatian dan memicu diskusi yang luas. Namun, terdapat satu kejanggalan dimana dalam beberapa jawaban, model tersebut mengklaim dirinya sebagai "ChatGPT", sehingga tidak sedikit yang beropini bahwa ini mungkin hanya tiruan semata. Namun, sebagai media teknologi yang berbasis di Hong Kong, kami lebih tertarik untuk menggali lebih dalam dan memahami mengapa AI ini bisa membuat industri terguncang hebat. Bukan sekedar tiruan murahan yang kita kenal selama ini, lantas apa sebenarnya terobosan yang ditawarkan oleh DeepSeek ini? Dalam penelusuran kita, DeepSeek bukan sekadar meniru apa yang telah ada, melainkan menambahkan inovasi yang cukup signifikan pada arsitektur dan algoritma dasar. Ini bukanlah sekadar tentang membangun ulang apa yang sudah diketahui, tetapi lebih kepada meningkatkan dan mengoptimalkan kemampuan yang bisa membawa AI ke tingkat selanjutnya. Elemen kunci di sini adalah integrasi teknologi terbaru yang memungkinkan pengolahan data lebih cepat dan akurat, sebuah langkah maju dalam dunia AI yang selalu haus akan kecepatan dan efisiensi. Terlepas dari kontroversi, yang menarik dari DeepSeek ini adalah kemampuannya untuk mendorong batas-batas yang ada dan memperlihatkan potensi AI dalam skala yang lebih luas. Ini adalah gambaran tentang masa depan AI yang tidak hanya tentang teknologi, tapi juga tentang bagaimana inovasi dapat diwujudkan dalam format yang lebih besar dan berdampak. Meski masih perlu bukti lebih lanjut untuk melihat hasil jangka panjang dari AI model v3 ini, namun antusiasme dan spekulasi di sekitarnya sudah cukup untuk menjadikan ini sebagai salah satu pembicaraan yang hangat di kalangan tech-savvy. Jadi, bagi Anda yang terpikat dengan seluk-beluk AI dan inovasi, perhatikan terus perkembangan dari DeepSeek ini, karena bisa jadi, kita sedang melihat awal dari sesuatu yang benar-benar revolusioner di dunia teknologi.
DeepSeek, ciptaan dari perusahaan modal ventura Tiongkok yang digarang "Fantasy Quant" pada tahun 2023, memusatkan perhatian pada pengembangan teknologi AI yang canggih. Meski baru berdiri, DeepSeek sudah menampilkan bakat inovasinya dengan cepat melalui DeepSeek-V3, model yang menggemparkan dengan 671 miliar parameter. Ini menetapkan standar baru antara performa dan biaya, dan bikin semua mata tertuju padanya!
Yang bikin semangat, DeepSeek cuma butuh dana 5,57 juta dolar AS untuk mengembangkan model AI yang canggih dalam waktu dua tahun saja. Bandingkan dong dengan biaya model GPT-4 dari OpenAI yang mencapai 63 juta dolar AS. Tentu saja, ini menunjukkan keuntungan biaya yang signifikan. Bahkan, ada prediksi kalau anggaran untuk model GPT-5 yang akan datang bisa mencapai 500 juta dolar AS. Prestasi ini tidak lepas dari berbagai inovasi teknologi yang mendukungnya.
Model DeepSeek-V3 sukses mengurangi kebutuhan sumber daya selama proses inferensi, berkat struktur "hybrid mixture of experts" yang unik. Struktur ini hanya memerlukan 370 miliar parameter untuk melakukan inferensi, yang secara signifikan mengurangi konsumsi sumber daya saat melakukan perhitungan real-time. Sebagai perbandingan, model lengkap seperti GPT-4, begitu diaktifkan, biasanya menghabiskan banyak kemampuan komputasi dan memori, bahkan kebutuhan memori bisa mencapai ratusan GB.
Untuk meningkatkan performa, DeepSeek-V3 menggabungkan teknologi Multi-Head Latent Attention (MLA) yang dapat efektif mengurangi kebutuhan memori saat memproses teks panjang, mengurangi konsumsi sumber daya hingga 96%. Selain itu, teknologi Relative Position Encoding (RoPE) yang ditambahkan juga memastikan data setelah kompresi masih mempertahankan informasi posisi yang diperlukan, meningkatkan kecepatan dan akurasi inferensi.
Terobosan teknologi ini menunjukkan bahwa teknologi AI di masa depan tidak hanya bisa berjalan dengan efisien di server-server high-end, tapi juga bisa dengan gampang dipindahkan ke perangkat elektronik konsumen seperti ponsel dan tablet. Ini memungkinkan pengguna menikmati layanan AI yang setara dengan perangkat keras berperforma tinggi dengan biaya yang lebih murah, benar-benar mewujudkan demokratisasi teknologi di pasar.
Namun, meskipun potensi DeepSeek cukup mengesankan, ada beberapa kekhawatiran yang muncul. Misalnya, dalam sebuah tes, DeepSeek-V3 mengaku sebagai ChatGPT, yang membuat banyak orang mempertanyakan apakah data pelatihannya mencakup konten dari ChatGPT. Kejadian ini memicu diskusi tentang kemandirian model dan transparansi data. Saat ini, DeepSeek belum memberikan respons resmi, yang menyoroti pentingnya transparansi dan regulasi dalam pengembangan teknologi AI. Sam dari OpenAI rupanya telah menyuarakan beberapa pendapat tentang masalah ini di platform X.
Setelah menggali lebih dalam mengenai teknologi di balik Deepseek, kita bisa melihat mengapa inovasi ini menciptakan gelombang besar di industri: pasar China memiliki sumber daya data terbesar di dunai, namun menghadapi berbagai batasan dalam hal kapasitas perangkat keras. Ini mendorong perusahaan AI di China untuk lebih fokus pada peningkatan efisiensi. Kesuksesan DeepSeek memperlihatkan keseimbangan baru antara sumber daya dan efisiensi. Sementara itu, dengan perusahaan besar seperti Google, Microsoft, dan Meta mulai menggunakan tenaga nuklir karena konsumsi energi yang besar dari pelatihan AI, start-up seperti DeepSeek memilih untuk mengurangi pemborosan sumber daya dengan inovasi teknologi, memberikan perspektif baru dalam solusi industri. Kisah DeepSeek mengingatkan kita bahwa persaingan di masa depan AI tidak hanya tentang teknologi itu sendiri, tetapi juga tentang menemukan solusi terbaik untuk penggunaan sumber daya, yang mungkin menjadi kunci dalam mengubah aturan main di pasar.



