Jakarta – Laboratorium artificial intelligence/AI (kecerdasan buatan) di China, DeepSeek meluncurkan large language model/LLM (model bahasa besar) sumber terbuka gratis pada akhir Desember 2024.
Hal ini dibangun menggunakan chip kemampuan rendah dari Nvidia yang disebut H800 sekitar US$6 juta selama dua bulan.
“Melihat model baru DeepSeek, sangat mengesankan dalam hal bagaimana mereka benar-benar efektif membuat model sumber terbuka dan sangat efisien dalam komputasi,” kata Chief Executive Officer (CEO) Microsoft Satya Nadella di Forum Ekonomi Dunia di Davos, Swiss belum lama ini.
Keberadaan DeepSeek di China mengungguli ketimbang di Amerika Serikat (AS) dengan biaya lebih murah dengan chip kurang bertenaga. Jadi, ini mengancam keunggulan global termasuk AS.
DeepSeek mengungguli Llama 3.1 milik Meta, GPT-4o milik OpenAI, dan Claude Sonnet 3.5 milik Anthropic dalam akurasi mulai pemecahan masalah yang rumit hingga matematika dan pengodean.
DeepSeek juga merilis r1, model penalaran yang juga mengungguli o1 terbaru OpenAI dalam banyak pengujian pihak ketiga.
“Kita harus menanggapi perkembangan dari China ini dengan sangat, sangat serius,” ucapnya.
DeepSeek harus mengatasi pembatasan semikonduktor ketat yang diberlakukan pemerintah AS terhadap China. Langkah ini memutus akses negara tersebut ke chip paling canggih, seperti H100 milik Nvidia.
Kemajuan terbaru menunjukkan bahwa DeepSeek menemukan cara untuk mengakali aturan tersebut.
Pendirinya DeepSeek, Liang WenFeng mengemukakan perusahaan ini bukan hanya sendiri yang mengembangkan lab tentang AI.
Perusahaan rintisannya 01.ai dilatih hanya dengan menggunakan dana US$3 juta dan ByteDance memperbarui modelnya yang mengklaim mengungguli OpenAI dalam pengujian.
“Kebutuhan adalah ibu dari penemuan. Karena mereka harus mencari solusi, mereka akhirnya membangun sesuatu yang jauh lebih efisien,” kata CEO Perplexity Aravind Srinivas. (adm)
Sumber: detik.com