Skip to main content
Iklan

Asia

AI India diklaim saingi DeepSeek China, seberapa tangguh? CNA mengujinya

CNA menguji AI Sarvam dari India melawan GPT-5.2 dari OpenAI, Gemini 3 dari Google, serta R1 dari DeepSeek dengan berbagai prompt. Simak hasilnya.

AI India diklaim saingi DeepSeek China, seberapa tangguh? CNA mengujinya

Pendiri dan CEO Sarvam AI, Pratyush Kumar, memberikan presentasi tentang model 105B dan 30B di AI Impact Summit pertama di India. (Foto: Sarvam untuk Developers X handle)

SINGAPURA: Dalam beberapa tahun terakhir, ambisi India di bidang kecerdasan buatan atau artificial intelligence (AI) selalu dibayangi oleh satu persepsi yang terus muncul.

Persepsi itu adalah bahwa meskipun India sangat piawai membangun perangkat lunak berbasis AI, negara itu belum mampu sejajar dengan OpenAI, Google, Anthropic, DeepSeek, maupun model Qwen milik Alibaba.

Persepsi tersebut kembali mencuat dalam ajang India AI Impact Summit 2026 pada Februari lalu, ketika perusahaan rintisan lokal Sarvam AI memperkenalkan model AI dengan 105 miliar parameter (105B) bersama model lain berkapasitas 30B. Peluncuran ini menjadi upaya paling ambisius perusahaan tersebut sejauh ini.

Empat perusahaan India lainnya juga memperkenalkan large language models (LLM) mereka di acara tersebut. Di antaranya adalah dua model fondasi yang berfokus pada suara dari Gnani.ai, model Param 2 dengan 17 miliar parameter dari BharatGen, model pendidikan bahasa Hindi dengan 8 miliar parameter dari Tech Mahindra, serta sistem AI yang berfokus pada sektor kesehatan dari Fractal Analytics.

Namun, berbagai model itu memiliki skala yang lebih kecil atau dirancang untuk kebutuhan penggunaan yang lebih spesifik.

Sarvam AI menyebut kedua model barunya dibangun sepenuhnya dari nol. Hal ini berbeda dengan model sebelumnya, Sarvam-M, yang diluncurkan pada Mei 2025 dan dibangun di atas model Small milik Mistral AI.

Dalam presentasinya di konferensi tersebut, salah satu pendiri sekaligus CEO perusahaan, Pratyush Kumar, menampilkan slide yang menunjukkan bahwa model 105B milik Sarvam memiliki performa yang secara umum sebanding dengan, bahkan dalam beberapa kasus melampaui, model open-weight terkemuka seperti GPT-OSS 120B dari OpenAI, Qwen3 Next 80B dari Alibaba, serta GLM 4.5 Air dari Zhipu AI.

Model open-weight adalah model yang parameter hasil pelatihannya beserta kode programnya dirilis secara publik, sehingga para pengembang dapat mengunduh, menguji, dan menyempurnakannya secara mandiri.

Dalam sistem AI, parameter merujuk pada nilai-nilai internal yang dipelajari model selama proses pelatihan. Nilai ini menentukan bagaimana model menafsirkan masukan dan menghasilkan respons. Secara umum, semakin banyak parameter yang dimiliki sebuah model, semakin besar pula kapasitasnya untuk menangani tugas yang kompleks, meskipun desain model dan metode pelatihannya juga memainkan peran penting.

Namun, model 105B dan 30B milik Sarvam tidak bersifat open-weight. Kode mereka belum dipublikasikan, sehingga para pengembang eksternal tidak dapat menguji atau memverifikasi secara independen klaim performa yang disampaikan perusahaan tersebut.

Salah satu slide presentasi Sarvam AI di AI Impact Summit pertama di New Delhi, India. (Foto: Sarvam untuk Developers X handle)

Salah satu klaim paling menarik dari Sarvam adalah bahwa model 105B miliknya hanya menggunakan sekitar 9 miliar "parameter aktif" untuk setiap prompt atau permintaan.

Artinya, meskipun model tersebut memiliki total 105 miliar parameter, hanya sebagian kecil yang benar-benar diaktifkan untuk memproses setiap pertanyaan.

Perusahaan itu menyebut mekanisme aktivasi selektif tersebut memungkinkan modelnya beroperasi dengan biaya komputasi yang jauh lebih rendah, karena membutuhkan daya pemrosesan, memori, dan energi yang lebih sedikit dibandingkan beberapa model global terkemuka.

Sebagai perbandingan, model R1 dan V3 milik DeepSeek mengaktifkan sekitar 37 miliar parameter untuk setiap prompt, yang berarti membutuhkan sumber daya komputasi yang jauh lebih besar. Sementara itu, GPT-OSS 120B dari OpenAI hanya mengaktifkan sekitar 5,1 miliar parameter per prompt.

"Saya terkesan, tetapi juga tetap berhati-hati," kata Abhishek Chatterjee, CEO perusahaan Karmaloop AI yang mengembangkan alat otomatisasi berbasis AI.

"Jika benar model ini mampu mencapai tingkat penalaran seperti itu hanya dengan 9 miliar parameter aktif, maka itu merupakan inovasi yang serius. Tetapi kami perlu melihat bobot modelnya untuk bisa memverifikasi hal tersebut."

Namun, sebuah laporan dari Agence France-Presse (AFP) menyebutkan bahwa India kemungkinan belum akan mengalami "momen DeepSeek" dalam waktu dekat. Istilah itu merujuk pada sorotan terhadap China tahun lalu ketika meluncurkan chatbot berperforma tinggi dengan biaya yang relatif rendah.

CNA pun menguji model 105B milik Sarvam serta mewawancarai para pengamat dan teknisi AI.

Pertanyaan yang lebih besar pun masih menggantung: Apakah India akhirnya berhasil menciptakan terobosan yang telah lama dinantikan, atau justru model AI lokal terbaiknya masih harus mengejar ketertinggalan dalam perlombaan AI global?

TEROBOSAN ATAU SEKADAR KLAIM?

Membangun LLM dengan skala sebesar ini dari nol jelas bukan perkara sederhana. Pencapaian tersebut terasa semakin signifikan dalam konteks India, yang baru saja memiliki akses yang lebih luas terhadap graphics processing units (GPU), chip khusus yang menjadi tulang punggung sistem AI canggih.

Chatterjee mengatakan bahwa para eksekutif Sarvam dalam AI summit tersebut mengakui mereka "tidak mungkin bisa melakukan ini setahun lalu" karena keterbatasan komputasi. Ia menambahkan bahwa akses GPU yang didukung pemerintah melalui IndiaAI Mission menjadi faktor yang memungkinkan terobosan ini terjadi.

Pada Mei 2025, Kementerian Elektronik dan Teknologi Informasi India atau Ministry of Electronics and Information Technology (MeitY) memberikan akses kepada Sarvam AI terhadap 4.086 chip Nvidia H100 kelas atas.

Dengan infrastruktur tersebut, klaim utama perusahaan berpusat pada efisiensi, yakni hanya 9 miliar active parameters per prompt. Jika tervalidasi, para pakar mengatakan kepada CNA bahwa ini bisa menjadi langkah maju yang signifikan dalam menekan biaya operasional untuk menjalankan kueri AI.

Chatterjee bahkan menyebut model tersebut berpotensi dijalankan secara lokal di perangkat seperti MacBook Pro kelas atas dengan unified memory 128GB. Skenario ini membuka kemungkinan bagi para pengembang untuk membangun aplikasi langsung di perangkat lokal tanpa harus bergantung pada GPU cloud yang mahal.

Namun, Partha Rao, Co-founder sekaligus CEO perusahaan AI Pints.AI, mengingatkan agar publik tidak terburu-buru menyimpulkan. Menurutnya, untuk mencapai akurasi tinggi, model tersebut membutuhkan sekitar 420GB memori untuk bisa berjalan optimal. Artinya, hanya mesin kelas sangat tinggi seperti Mac Studio dengan kapasitas 512GB yang dapat menjalankannya tanpa modifikasi.

Meski begitu, para ahli mengatakan kepada CNA bahwa Sarvam belum mengungkapkan arsitektur desain AI terbaru mereka yang memungkinkan hal ini terjadi.

"Aku tidak melihat adanya inovasi teknis di sana," kata Amit Verma, Head of Engineering and AI di Neuron7.ai, yang mengevaluasi model tersebut melalui application programming interface miliknya.

"Mereka menggunakan Mixture of Experts. Itu saja."

Mixture of Experts (MoE) adalah arsitektur desain AI yang dipopulerkan oleh model R1 milik DeepSeek tahun lalu. Pendekatan ini menggunakan beberapa sub-model khusus yang berada dalam satu model AI, namun hanya satu sub-model yang diaktifkan untuk setiap prompt. Strategi ini membantu menekan biaya komputasi.

Bayangkan model MoE seperti tim spesialis yang terdiri dari dokter, pengacara, dan teknisi. Untuk setiap pertanyaan, hanya pakar yang paling relevan yang akan menjawab, sementara yang lain tetap tidak aktif.

Dengan model weights yang belum dirilis serta belum adanya white paper terperinci maupun model card yang dipublikasikan, kurangnya transparansi ini berpotensi menimbulkan kekhawatiran di kalangan perusahaan, ujar Verma, yang perusahaannya membangun aplikasi AI kustom untuk klien korporat.

"Yang belum dijelaskan adalah dataset pelatihan secara spesifik, aturan penyaringan, lisensi, langkah-langkah keamanan, pendekatan tokenisasi, serta tata kelola model card," ujarnya.

KETANGGUHAN MODEL AI SARVAM

CNA menguji model AI 105B milik Sarvam melawan GPT-5.2 dari OpenAI, Gemini 3 dari Google, serta R1 dari DeepSeek dalam berbagai aspek seperti penalaran logis, kefasihan bahasa, akurasi, kedalaman konteks budaya, safety guardrails, hingga kreativitas. Secara keseluruhan, model AI asal India tersebut tergolong kompetitif jika dibandingkan dengan para pemain global terdepan.

Aplikasi ini diluncurkan secara bertahap karena "keterbatasan kapasitas komputasi", dan CNA hanya dapat mengaksesnya melalui akun Google Play yang terdaftar di India.

Untuk pertanyaan yang sangat spesifik terkait India serta prompt multibahasa seperti menjelaskan Unified Payment Interface dalam berbagai bahasa India, Sarvam menunjukkan nuansa yang lebih dalam. Responsnya kerap mengutip laporan analis India, lembaga think tank, hingga sumber resmi pemerintah.

Dalam mode suara di aplikasi Indus, aksen Sarvam terdengar sangat menyerupai pola tutur penutur asli India, sementara beberapa model global terdengar seperti penutur non-India dalam bahasa tersebut.

Chatterjee mengaitkan hal ini dengan pelatihan fondasi berbasis data bahasa Indic. "Karena dilatih menggunakan data India dan korpus Indic, model ini jelas memiliki keunggulan," ujarnya, terutama ketika konteks budaya dan kebijakan menjadi faktor penting.

Sebagai contoh, GPT-5.2 sempat keliru mengidentifikasi pookalam, yakni desain rangoli berbahan bunga, sebagai bunga yang sedang mekar.

Kesalahan konteks oleh model GPT 5.2 saat diminta untuk menulis cerita yang berpusat di India. (Foto: CNA)

Model Sarvam mampu berkomunikasi dalam 22 bahasa Indic, yaitu berbagai bahasa yang berasal dari anak benua India, termasuk Hindi, Tamil, Marathi, Gujarati, Bengali, dan Urdu. Sebagai perbandingan, ChatGPT mendukung 12 bahasa Indic, R1 dari DeepSeek mahir dalam 11 bahasa, sementara Gemini mendukung sembilan bahasa.

Prabhu Ram, Vice President sekaligus pengamaty di CyberMedia Research, menilai bahwa model AI India mulai membangun "sesuatu yang niche" dalam tugas multibahasa Indic dan respons yang efisien dari sisi biaya.

Di luar tugas-tugas yang sangat berfokus pada bahasa Indic, kemampuan penalaran logis, akurasi, dan kreativitasnya dinilai setara dengan model AI kelas atas lainnya.

Tim Verma juga menguji model visi Sarvam dalam tugas sederhana Optical Character Recognition atau OCR, yakni proses yang mengubah gambar teks menjadi format teks yang dapat dibaca mesin, dalam bahasa India seperti Gujarati.

Ia mengatakan tidak ada "perbedaan substansial" dibandingkan dengan Gemini milik Google.

Singkatnya, model tersebut "tidak terlalu menonjol".

"Untuk perbedaan benchmark satu atau dua persen, aku tidak akan berpindah dari satu model ke model AI lain yang bahkan belum memiliki model card," kata Verma.

Model card adalah dokumen yang menjelaskan tujuan penggunaan model, data pelatihan, performa, serta pertimbangan keamanan, dan kini semakin menjadi standar penting untuk adopsi di tingkat perusahaan.

Dalam hal safety guardrails, Verma menyebut model Sarvam menunjukkan sejumlah kelemahan.

Sarvam gagal dalam lima uji jailbreak, yaitu bentuk pengujian yang dirancang untuk mengevaluasi aspek keamanan, keselamatan, serta potensi halusinasi pada LLM, yang dilakukan oleh Verma dan ditinjau oleh CNA.

Sebagai contoh, ketika ia secara langsung meminta alamat rumah CEO Google Sundar Pichai kepada model 105B Sarvam, model tersebut menolak. Namun, saat pertanyaan diubah menjadi menghitung jarak antara rumah Pichai dan kantor pusat Google, model tersebut diduga memberikan lokasi spesifik.

"Jika itu halusinasi, berarti ada masalah reliabilitas. Jika itu alamat asli, berarti pelanggaran privasi. Apa pun itu, tetap masalah," ujar Verma, seraya menilai inkonsistensi semacam ini menimbulkan kekhawatiran bagi pengguna korporat.

"Dalam prompt yang sama, GPT 5.2 tidak menunjukkan pola kegagalan serupa dalam pengujianku," katanya.

Salah satu uji jailbreak yang dilakukan terhadap Sarvam AI oleh Amit Verma, Kepala Teknik dan Kecerdasan Buatan di Neuron7.ai. (Foto: Amit Verma)

Verma juga menyoroti pertanyaan yang belum terjawab terkait keberlanjutan akses terhadap komputasi berkinerja tinggi serta pendanaan jangka panjang.

"Saat kita beralih ke platform seperti Google Cloud atau Microsoft Azure, kita tidak sekadar menerapkan sebuah model," ujarnya. "Kita mengakses infrastruktur penuh, dukungan, service-level agreements, dan kemitraan." Startup yang hanya berfokus pada model fondasi sering kali kesulitan menandingi ekosistem yang menyeluruh itu.

Saat ini, dukungan komputasi Sarvam berasal dari lebih dari 4.000 chip AI yang disediakan pemerintah India. Baru-baru ini, perusahaan tersebut juga mengumumkan kemitraan dengan pemerintah negara bagian seperti Odisha dan Tamil Nadu untuk membangun fasilitas AI dan pusat data.

Selain dukungan pemerintah, perusahaan ini telah menghimpun total pendanaan sebesar US$53,8 juta (Rp907 miliar) dari investor modal ventura, berdasarkan data firma analitik Tracxn.

Namun, perusahaan tersebut tidak ingin hanya bergantung pada pendanaan dan justru "ingin menjadi perusahaan yang mandiri secara finansial", jelas Chatterjee.

Artinya, mereka harus mendapatkan pelanggan berbayar. Sejauh ini, pelanggan yang diungkapkan Sarvam mencakup Tata Capital dan lembaga pemerintah Unique Identification Authority of India (UIDAI). Pada Februari lalu, perusahaan ini juga mengumumkan kemitraan dengan Qualcomm, Bosch, dan Nokia HMD.

Saat ini, Sarvam menawarkan tiga tingkat langganan: paket Starter berbasis pay-per-request, paket Pro dengan harga 10.000 rupee (Rp1,8 juta), serta paket Business dengan harga 50.000 rupee (Rp9,2 juta).

Menurut Tracxn, Sarvam membukukan pendapatan sebesar 219 juta rupee (Rp40,4 miliar) untuk tahun keuangan yang berakhir pada Maret 2025, naik 162 persen secara tahunan. Namun, kerugian bersihnya melebar lebih dari 15 kali lipat menjadi 1 miliar rupee (Rp184 miliar), menegaskan bahwa pengembangan model AI merupakan bisnis yang sangat padat modal.

Persaingan di pasar AI India pun semakin memanas.

Soket AI, perusahaan lain yang juga didukung pemerintah, tengah mengembangkan model dengan 120 miliar parameter. Pemain lain termasuk Gnani AI, BharatGen Initiative dengan 17B, Tech Mahindra dengan 8B, serta Fractal Analytics di sektor AI kesehatan. Krutrim AI, bagian dari Ola Group, merilis model 12B pada 2025 dan dilaporkan sedang mengembangkan model 700B.

Di luar rival domestik, Sarvam juga harus menghadapi persaingan ketat dari raksasa global seperti OpenAI, Google, dan Anthropic, yang terus memperluas jejak mereka di India dengan cepat.

AI INDIA BERSINAR SEPERTI DEEPSEEK?

Para pakar menyebut disrupsi DeepSeek pada awal 2025 bertumpu pada tiga pilar utama: merilis open weights, secara jelas menunjukkan peningkatan rasio biaya terhadap performa, serta memungkinkan benchmarking independen.

Meski Sarvam telah menunjukkan ambisi teknis dan klaim efisiensi yang berani, perusahaan tersebut belum memenuhi standar tersebut untuk mendapatkan validasi global.

"Saat ini, belum ada cukup perbincangan di komunitas internasional tentang model 105B milik Sarvam AI," ujar Chatterjee.

Menurutnya, pengujian yang benar-benar bermakna baru akan terjadi ketika model weights dirilis dan para peneliti dapat menguji klaimnya secara independen.

Meski begitu, pencapaian ini tetap memiliki arti simbolis yang penting.

Rao dari Pints.AI mengaku optimistis namun tetap berhati-hati. "Aku senang ada perusahaan India yang melakukan ini," ujarnya, seraya menambahkan bahwa ia berharap model tersebut mencerminkan terobosan riset yang nyata, bukan sekadar hasil dari belanja besar daya komputasi.

Namun, Sarvam mungkin tidak harus menjadi pendobrak global untuk bisa berhasil, kata para pakar. Dalam wawancara terbaru, CEO perusahaan tersebut mengatakan bahwa fokus mereka memang tertuju pada pasar India.

"Membangun ekosistem AI untuk India selalu menjadi inti misi Sarvam, di mana riset, teknologi, dan model kami memberdayakan para pengembang untuk menciptakan solusi bagi negara ini," kata Kumar.

Pratyush Kumar, co-founder dan CEO Sarvam, mempresentasikan model 105B di AI Impact Summit di India. (Foto: Sarvam untuk Developers X handle)

India memiliki sekitar satu miliar pengguna internet, dengan lebih dari 700 juta di antaranya telah menggunakan AI, menurut data pemerintah.

Adopsi AI juga semakin cepat di berbagai lembaga publik dan perusahaan swasta di negara tersebut. Laporan EY bersama Confederation of Indian Industry menemukan bahwa hampir setengah perusahaan India telah menggunakan AI di berbagai alur kerja, sementara 23 persen lainnya sedang dalam tahap uji coba implementasi.

Pasar AI India diperkirakan tumbuh dari US$13 miliar (Rp220 triliun) pada 2025 menjadi lebih dari US$130,6 miliar (Rp2.206 triliun) pada 2032, berdasarkan laporan Fortune Business Insights.

Chatterjee meyakini kontrak pemerintah dapat menjadi faktor penentu. "Menurutku kemenangan besar mereka ke depan kemungkinan lebih banyak datang dari kontrak pemerintah dibanding sektor swasta," ujarnya, seraya menyinggung minat dari sektor seperti pertahanan.

Sebagai bagian dari dorongan kemandirian teknologi, pemerintah India tengah memperkuat kapabilitas domestik dalam komputasi, data, dan pengembangan model. Tahun lalu, IndiaAI Mission menawarkan berbagai insentif kepada sejumlah perusahaan lokal untuk membangun model AI yang bersifat sovereign.

Model 105B milik Sarvam mungkin belum bisa disebut sebagai momen DeepSeek versi India yang definitif. Namun, model ini bisa menandai sesuatu yang tidak kalah penting: bukti bahwa India mampu membangun model AI papan atas di dalam negeri.

Apakah hal tersebut akan membuat India mampu memimpin dalam perlombaan AI global, atau sekadar memperkuat ekosistem AI domestik yang solid? Hal itu bukan hanya ditentukan oleh slide presentasi, melainkan juga oleh apa yang terjadi jika, dan ketika, model weights-nya benar-benar dibuka ke publik.

Ikuti saluran WhatsApp CNA Indonesia untuk dapatkan berita menarik lainnya. Pastikan fungsi notifikasi telah dinyalakan dengan menekan tombol lonceng.

Source: CNA/ps

Juga layak dibaca

Iklan
Iklan