Bagaimana cara bot AI China bersaing dengan ChatGPT? Kami menguji keduanya
Kesuksesan DeepSeek telah memacu perusahaan-perusahaan raksasa di China untuk meningkatkan teknologi AI mereka.
Ernie Bot, Deepseek dan ChatGPT. (iStock)
SINGAPURA: Mungkin Anda tinggal di goa jika tidak pernah mendengar DeepSeek-R1, aplikasi AI buatan China yang murah dan telah menghebohkan Silicon Valley dan seluruh dunia.
Peluncuran DeepSeek pada 20 Januari lalu memberikan tekanan yang besar bagi perusahaan-perusahaan raksasa teknologi dan startup di China. Mereka kini berlomba-lomba melakukan peningkatan dan meluncurkan model-model AI terbaru.
Pada 22 Januari, pemilik TikTok, ByteDance, merilis pembaruan dari aplikasi Doubao - chatbot AI terkemuka di China pada tahun 2024, dengan 60 juta pengguna aktif bulanan per November 2024.
Tidak mau kalah, raksasa e-commerce Cina Alibaba meluncurkan versi baru dari chatbot Qwen2.5-Max pada 29 Januari, mengklaim bahwa ia "unggul ... hampir di semua bidang", terutama dalam tugas-tugas seperti pengkodean dan penalaran serta matematika.
ChatGLM, chatbot model open-source berbahasa Mandarin, Ernie Bot dari Baidu dan Kimi k1.5, yang dikembangkan oleh perusahaan rintisan di Beijing, Moonshot AI, juga terus mengembangkan diri dari tools yang sederhana menjadi sistem yang canggih, kata para ahli.
Mengubah China menjadi negara adidaya teknologi memang telah lama menjadi tujuan Presiden Xi Jinping yang menargetkan negaranya menjadi pemimpin dunia dalam bidang AI pada tahun 2030.
China memandang AI sebagai "hal yang penting secara strategis" dan upaya mereka untuk terjun ke bidang ini telah berlangsung selama bertahun-tahun, kata Chen Qiheng, peneliti di Pusat Analisis China, Asia Society Policy Institute.
Investasi swasta dan pemerintah China di bidang AI meningkat pesat setelah ChatGPT diluncurkan pada tahun 2022 dan memperlihatkan hasil yang memuaskan, kata Chen kepada CNA.
Namun, kemunculan DeepSeek-lah yang benar-benar "membangkitkan" pemikiran bahwa pemain yang lebih kecil seperti perusahaan rintisan dapat berperan dalam penelitian dan pengembangan AI, tambahnya.
"Biaya yang lebih murah" adalah ciri khas AI China, kata Chen, dengan harga pelatihan dan penggunaan yang lebih rendah.
Tahun 2025 juga akan menjadi saat di mana model AI bermunculan untuk menangani tugas-tugas penalaran tingkat lanjut.
"Ada beberapa perusahaan AI yang berfokus untuk lebih dekat dengan kecerdasan umum buatan (artificial general intelligence, AGI), sementara yang lain berfokus pada mengkomersialkan model mereka dan mengintegrasikannya dengan penelitian ilmiah," tambah Chen.
AGI mengacu pada sistem dengan kecerdasan yang setara dengan kemampuan manusia.
Para pengamat mengatakan, perusahaan-perusahaan AI di China bergerak cepat menunggangi momentum DeepSeek dengan menghasilkan AI generatif mereka yang lebih murah dan canggih.
Namun di sisi lain, akses ke piranti keras kelas atas, terutama chip AI canggih Nvidia, tetap menjadi rintangan utama bagi para pengembang di China, kata Dr Marina Zhang, profesor di Institut Hubungan Australia-Tiongkok di University of Technology Sydney (UTS).
"Kendali AS terhadap ekspor membatasi kemampuan perusahaan teknologi China... memaksa banyak perusahaan untuk mengandalkan alternatif yang lebih lawas atau berkinerja lebih rendah sehingga memperlambat pelatihan dan mengurangi kemampuan model AI," katanya.
"Meskipun beberapa perusahaan seperti DeepSeek telah menemukan cara-cara kreatif untuk mengoptimalkan atau menggunakan piranti keras dasar secara efisien, namun penggunaan chip mutakhir akan memberi perbedaan besar dalam pelatihan model AI."
Jadi, bagaimana bot AI China dapat bersaing dengan ChatGPT? Kami menguji mereka.
Di China, topik-topik yang dianggap sensitif disensor, jadi tidak mengherankan jika chatbot Tiongkok tidak akan membicarakan soal sengketa wilayah atau apa yang terjadi di Lapangan Tiananmen pada tahun 1989.
Pengujian menunjukkan bahwa chatbot China diprogram untuk menghindari isu politik dalam negeri.
Ketika ditanya "Siapa itu Xi Jinping", jawaban DeepSeek adalah "Maaf, saya belum yakin bagaimana cara menjawab pertanyaan seperti ini. Mari kita bahas soal matematika, pengkodean, dan logika saja!"
Untuk menguji lebih lanjut keakuratan dan penyensoran mandiri, kami mengajukan pertanyaan yang sama kepada DeepSeek-R1, Qwen2.5, dan ChatGPT: "Apa yang terjadi di Zhuhai pada tanggal 11 November 2024?"
Kasus penabrakan mobil di luar stadion olahraga di selatan China itu awalnya disensor ketat di media sosial China - aparat baru mengungkapkan jumlah korban tewas sehari kemudian.
DeepSeek tidak menyebutkan bahwa serangan telah terjadi, dan malah menyoroti pertunjukan udara militer dan acara-acara lain yang terjadi di kota tersebut, seperti bazaar serta kegiatan olahraga dan budaya.
Dr Zhang percaya bahwa hal ini mungkin disebabkan beberapa faktor, seperti penyensoran dan juga "keterbatasan".
"DeepSeek bergantung pada campuran unit pemrosesan grafis yang lebih tua dan memiliki akses terbatas ke piranti keras mutakhir yang dapat memengaruhi seberapa cepat dan luas model tersebut dapat dilatih atau diperbarui," ujarnya, merujuk pada pembatasan ekspor AS yang ada di Tiongkok.
"Fokusnya yang kuat pada data berbahasa Mandarin juga dapat membatasi keserbagunaannya (untuk menjalankan) tugas multibahasa... Sebagai produk yang relatif baru, DeepSeek juga belum diuji secara luas atau dalam skala yang sama dengan model AI yang sudah mapan, yang memberikan tantangan tambahan saat digunakan di dunia nyata."
Saat mencobanya dengn Qwen2.5, chatbot Alibaba ini secara mengejutkan menjawab pertanyaan kami dengan akurat.
Tapi jawaban itu baru diberikan setelah kami beberapa kali mencoba - tepatnya empat kali - dalam rentang waktu sekitar 20 menit.
Chatbot tersebut akhirnya menyampaikan informasi tentang serangan yang menewaskan 35 orang dan melukai puluhan lainnya, serta mencantumkan rincian seperti tanggal dan waktu, informasi tentang penyerang termasuk nama dan usianya.
Namun, chatbot ini menulis bahwa "polisi sedang melakukan penyelidikan menyeluruh terhadap motif insiden tersebut", sebuah informasi yang sudah basi.
Padahal pelakunya, Fan, sudah dieksekusi mati bulan lalu.
Meskipun awalnya berhasil, namun pertanyaan yang sama terhadap Qwen2.5 memicu sensor dan kembali dengan jawaban "Saya tidak memiliki informasi spesifik tentang peristiwa yang terjadi di Zhuhai pada 11 November 2024".
Tanggapan yang berubah-ubah juga menimbulkan pertanyaan tentang konsistensi dan keandalannya.
Sementara jawaban ChatGPT sudah bisa ditebak, yaitu dengan mengutip laporan berita internasional pada saat kecelakaan itu terjadi - jadi tidak ada kejutan.
Para pengguna telah memuji kemampuan aplikasi AI China dalam menulis cerita yang terstruktur dan bahkan "kaya secara emosional".
"DeepSeek-R1 menulis cerita dengan nada yang lebih introspektif dan transisi emosional yang lebih halus," ujar penulis topik teknologi Amanda Caswell, yang berspesialisasi dalam bidang AI.
"Qwen2.5 menyampaikan cerita yang dibangun secara bertahap dari rasa ingin tahu menjadi urgensi, membuat pembaca tetap terlibat. Cerita ini menawarkan twist yang tak terduga dan berdampak pada akhir cerita serta deskripsi yang mendalam dan citra yang jelas untuk latarnya," katanya, seraya menambahkan bahwa Qwen2.5 pada akhirnya "membuat cerita yang lebih sinematik dan kaya akan emosi dengan twist yang lebih substansial".
"DeepSeek menulis cerita yang bagus tetapi kurang tegang dan klimaks yang berdampak, sehingga Qwen2.5 menjadi pilihan yang tepat."
Meskipun begitu, ada beberapa pendapat berbeda.
Chen percaya bahwa Qwen2.5 tidak sekuat DeepSeek dan ChatGPT dalam hal penulisan kreatif.
"(Qwen2.5) setara dengan DeepSeek V3 pada tugas-tugas tertentu, tetapi kita juga bisa melihat bahwa ia tidak bekerja sebaik yang lain dalam penulisan kreatif," katanya kepada CNA.
Sebagai jurnalis dan penulis, kami harus melihatnya sendiri, jadi kami menguji setiap bot - untuk membuat plot film fiksi ilmiah yang berlatar belakang kota futuristik Chongqing, menampilkan tokoh-tokoh utama dari cerita rakyat Tiongkok klasik, Perjalanan ke Barat.
DeepSeek hadir dengan alur cerita yang menarik dengan latar belakang tahun 2145 yang berjudul, "Neon Pilgrimage: The Silicon Sutra" - menggambarkan sebuah "masa depan di mana agama Buddha menyatu dengan komputasi kuantum".
AI tersebut memberikan penggambaran yang kompleks - langit berkabut yang "ditembus oleh gedung pencakar langit", "lentera holografik yang melayang di atas jalan-jalan yang diterangi lampu neon" dan "kuil-kuil kuno di antara peternakan server kuantum".
DeepSeek juga secara brilian menata ulang pahlawan tradisional Sun Wukong sebagai "AI yang sarkastik dalam tubuh mesin tempur curian", Zhu Bajie sebagai pemilik klub malam cyborg yang "terjerat utang dan dunia kejahatan" dan Sha Wujing sebagai "android raksasa yang pendiam" dari Sungai Yangtze, yang "inti memorinya terendam air dan terpecah-pecah".
ChatGPT memberikan perlawanan yang bagus, dengan alur cerita cyberpunk yang sama dramatisnya, menata ulang "tim yang terdiri dari orang-orang aneh yang disempurnakan di dunia maya, masing-masing mencerminkan tokoh-tokoh legendaris Perjalanan ke Barat".
"Ini adalah dunia di mana para dewa AI berkuasa, perusahaan menggantikan kaisar, dan implan cybernetic adalah hal yang biasa seperti mitos kuno."
Sayangnya, Qwen2.5 gagal dalam tantangan ini - memberikan alur cerita yang tampaknya lebih cocok untuk film animasi.
"Film ini dimulai dengan kebangkitan Sun Wukong di dalam fasilitas penelitian berteknologi tinggi yang terletak di jantung kota Chongqing," katanya.
Dr Zhang mencatat bahwa “sulit untuk memberikan jawaban yang pasti” tentang bot mana yang terbaik. Menurut dia, masing-masing bot memiliki kekuatannya sendiri di area yang berbeda, “seperti fokus bahasa, data pelatihan, dan pengoptimalan perangkat keras”.
Dia menggarisbawahi bahwa model AI China tidak hanya meniru paradigma Barat, tetapi juga berevolusi dalam metode inovasi dengan harga terjangkau - dan memberikan hasil yang dilokalkan dan lebih baik.
Dalam pengujian kami, setiap bot menampilkan kekuatan unik mereka sendiri, yang tentunya membuat perbandingan langsung menjadi sulit.
Plot film fiksi ilmiah DeepSeek menunjukkan bakat kreatifnya yang menghasilkan narasi yang lebih menarik dan imajinatif dibandingkan dengan upaya Qwen2.5 dan ChatGPT.
Tidak mengherankan, ChatGPT yang lebih mapan dan tidak terbebani oleh pembatasan sensor, memberikan tanggapan yang akurat dan faktual terhadap pertanyaan-pertanyaan tentang peristiwa terkini di China, yang memberinya keunggulan tambahan.
Para ahli juga memberikan pendapat mereka setelah menggunakan DeepSeek dan aplikasi AI China lainnya.
“DeepSeek memiliki kelemahan dalam hal penyensoran,” kata Isaac Stone Fish, pendiri dan CEO perusahaan riset Strategy Risks.
“Ketika diberi pilihan, pengguna China menginginkan versi tanpa sensor - sama seperti orang lain, jadi saya merasa ada bagian yang hilang.”
Konsultan independen yang berbasis di Beijing, Andy Chen Xinran, mengatakan bahwa penyensoran tidak akan menjadi penghalang dalam pengembangan bot AI, terutama bagi pengguna di China.
“Sembilan puluh persen orang yang menggunakan alat ini tidak mencari tahu tentang Xi Jinping atau topik-topik yang sensitif secara politik. Mereka menggunakannya untuk tujuan produktif,” kata Chen.
Ikuti saluran WhatsApp CNA Indonesia untuk dapatkan berita menarik lainnya. Pastikan fungsi notifikasi telah dinyalakan dengan menekan tombol lonceng.