Alibaba Cloud Rilis Qwen-7B Model AI yang Punya 7 Miliar Parameter

Gizmologi Asus GU605 Tech Media Banner INTEL

Jakarta, Gizmologi – Sejak awal tahun, Alibaba Cloud telah memperkenalkan sejumlah model AI buatannya, terbaru adalah Qwen-7B-Chat. Sebuah pemodelan besar atau Large Language Models-LLM yang memiliki parameter hingga 7 miliar kombinasi potensial untuk dikembangkan.

Model AI Qwen-7B-Chat dikembangkan bersama ModelScope dan platform kolaboratif berbasis kecerdasan buatan milik Hugging Face. Qwen-7B-Chat rencananya akan ditujukan untuk memberikan solusi kepada perusahaan komersial maupun developer lokal dalam mengembangkan generatif AI.

“Dengan menyediakan sumber terbuka untuk model bahasa besar eksklusif kami, kami ingin mempromosikan teknologi inklusif dan memungkinkan lebih banyak developer dan UMKM untuk mendapatkan manfaat dari AI generatif,” kata Jingren Zhou, CTO Alibaba Cloud Intelligence, dalam keterangan yang diterima Gizmologi, Rabu (9/8/2023).

Sebelumnya, Alibaba Cloud memperkenalkan LLM miliknya, Tongyi Qianwen, pada bulan April di awal tahun ini. Model canggih ini mampu menghasilkan konten mirip manusia dalam bahasa Mandarin dan Inggris, dengan berbagai ukuran model, termasuk model dengan parameter tujuh miliar atau lebih.

Dalam upaya demokratisasi teknologi AI, kode model, bobot model, dan dokumentasi akan dapat diakses secara bebas oleh kalangan akademisi, peneliti, dan lembaga komersial di seluruh dunia. Untuk penggunaan komersial, model-model tersebut akan dapat digunakan secara gratis oleh perusahaan-perusahaan dengan jumlah pengguna aktif bulanan kurang dari 100 juta.

“Sebagai pendukung dengan komitmen jangka panjang terhadap inisiatif sumber terbuka, kami berharap pendekatan terbuka ini juga dapat membawa kebijaksanaan kolektif untuk lebih membantu berkembangnya komunitas sumber terbuka,” tambahnya.

Model Qwen-7B-Chat telah dilatih dengan lebih dari 2 triliun token yang mencakup materi berbahasa Mandarin, Inggris, dan multibahasa lainnya, kode, serta matematika, mencakup bidang umum dan profesional. Panjang konteksnya mencapai 8K.

Baca Juga: Perbarui AnalyticDB, Konsumen Alibaba Cloud Bikin AI Generatif Cuma 30 Menit

Hasil Pengujian Qwen-7B milik Alibaba Cloud

Hasil benchmark Qwen-7B — Benchmark Qwen-7B milik Alibaba Cloud

Bahkan selama pelatihan, model Qwen-7B-Chat diselaraskan dengan instruksi manusia. Sehingga dapat diimplementasikan pada infrastruktur cloud dan piranti lokal ketika melakukan penyesuaian ulang dalam membangun model AI generatif yang lebih efisien.

Platform buatan Alibaba Cloud ini juga berhasil mencetak skor tertinggi dalam uji benchmark Massive Multi-task Language Understanding (MMLU), dengan mencetak skor 56,7, mengungguli model open-source yang sudah ada dengan skala yang serupa atau bahkan beberapa model yang lebih besar. Selain itu, Qwen-7B mencapai kinerja tinggi pada uji benchmark matematika dan pembuatan kode, seperti GSM8K dan HumanEval.

“Qwen-7B meraih skor tertinggi di antara model-model lainnya dengan parameter yang setara dalam leaderboard C-Eval, suatu rangkaian evaluasi komprehensif untuk model-model dasar dalam bahasa Mandarin. Ini mencakup 52 subjek dalam empat spesialisasi utama, termasuk humaniora, ilmu sosial, STEM, dan lainnya.”

Di sisi lain, Alibaba Cloud juga mengungkapkan ModelScopeGPT, kerangka serbaguna yang dirancang untuk membantu pengguna dalam melakukan tugas-tugas AI yang kompleks dan khusus di berbagai bidang bahasa, visi, dan ucapan dengan memanfaatkan berbagai model AI di ModelScope. Diluncurkan oleh Alibaba Cloud tahun lalu, ModelScope adalah komunitas model AI sumber terbuka yang saat ini memiliki lebih dari 1.000 model AI yang disumbangkan oleh 20 institut AI terkemuka.