Jakarta, Gizmologi – Alibaba Cloud hadirkan dua Large Language Models (LLM) open source, yaitu Qwen-72B dan Qwen-1.8B, versi 72-miliar parameter dan 1,8-miliar parameter dari model fondasi milik Alibaba, Tongyi Qianwen, di komunitas model AI mereka, ModelScope, dan platform AI kolaboratif, Hugging Face, pada Rabu (20/12/2023). Perusahaan meluncurkan LLM open source karena memiliki cita-cita menjadi cloud paling terbuka dan membuat kemampuan AI generatif dapat diakses oleh semua orang.
“Membangun ekosistem open-source sangat penting untuk mendorong pengembangan LLM dan aplikasi AI. Kami bercita-cita menjadi cloud paling terbuka dan membuat kemampuan AI generatif dapat diakses oleh semua orang,” ujar Jingren Zhou, CTO Alibaba Cloud.
Alibaba Cloud juga menyediakan lebih banyak LLM multimodal termasuk Qwen-Audio dan Qwen-Audio-Chat, versi model pemahaman audio yang telah dilatih sebelumnya dan penyempurnaan percakapan, untuk tujuan penelitian dan komersial. Pelopor cloud ini telah berkontribusi untuk menyediakan berbagai ukuran LLM dengan parameter mulai dari 1,8B, 7B, 14B hingga 72B, serta LLM multimodal dengan fitur pemahaman audio dan visual.
Baca Juga: Google Perkenalkan MedLM, AI Generatif untuk Industri Kesehatan
LLM Open Source Alibaba Cloud Bisa untuk Perusahaan atau Lembaga Penelitian

Dengan pelatihan sebelumnya yang dilakukan pada lebih dari 3 triliun token, model 72-miliar parameter yang disediakan Alibaba mengungguli model-model open-source utama lainnya dalam sepuluh tolok ukur, antara lain termasuk tolok ukur untuk Massive Multi-task Language Understanding (MMLU) yang mengukur akurasi model multitask, HumanEval yang menguji kemampuan generasi kode, dan GSM8K, tolok ukur untuk masalah aritmetika. Model ini juga menunjukkan kemahirannya dalam menangani berbagai perintah rumit.
Yaitu termasuk bermain peran dan transfer gaya bahasa, yang merujuk pada kemampuan LLM untuk mengambil peran atau persona tertentu dan menghasilkan respons yang lebih relevan secara kontekstual sesuai dengan persona tersebut. Fitur seperti ini dapat berguna dalam aplikasi AI seperti chatbot yang dipersonalisasi.
Alibaba Cloud mengatakan perusahaan dan lembaga penelitian dapat mengakses LLM open source kode model Qwen-72B, bobot model, dan dokumentasi serta menggunakannya secara gratis untuk tujuan penelitian. Untuk penggunaan komersial, model tersebut akan gratis digunakan untuk perusahaan dengan pengguna bulanan aktif yang kurang dari 100 juta.
Perusahaan cloud ini juga mengumumkan bahwa mereka telah menyediakan secara open source model LLM berparameter 1,8 miliar yang dapat berjalan pada edge. LLM kelas ringan ini memungkinkan inferensi pada perangkat edge dengan sumber daya komputasi terbatas, membuatnya memungkinkan untuk diterapkan pada perangkat seperti ponsel.
Versi yang berukuran lebih kecil dengan kebutuhan sumber daya komputasi yang lebih rendah ini dapat berguna bagi individu yang mencari opsi yang lebih hemat biaya dan mudah diterapkan dalam menggunakan LLM. Model 1,8B saat ini hanya tersedia untuk tujuan penelitian.
Untuk menawarkan LLM yang dapat memproses berbagai format input yang lebih besar, Alibaba Cloud juga mengumumkan bahwa mereka telah menyediakan secara open-source, Qwen-Audio dan Qwen-Audio-Chat. Keduannya merupakan model AI dengan kemampuan pemahaman audio terbaru untuk tujuan penelitian dan komersial.
Qwen-Audio dapat memahami input teks dan audio dalam berbagai format, termasuk ucapan manusia, suara natural dan musik, dan menghasilkan teks sebagai output. Model ini mampu melakukan lebih dari 30 tugas pemrosesan audio, seperti transkripsi multi-bahasa, pengeditan ucapan, analisis keterangan audio, dan lainnya. Versi yang disempurnakan untuk percakapan, Qwen-Audio-Chat, dapat mendukung beberapa putaran tanya jawab berdasarkan audio dan melakukan berbagai tugas berorientasi audio, seperti deteksi emosi dan nada dalam pidato manusia.
Inisiatif ini menandai upaya lainnya dari Alibaba Cloud untuk menawarkan model multi-modal large language model yang dapat memahami jenis data di luar teks ke komunitas open-source. Awal tahun ini, mereka mengumumkan peluncuran Large Vision Language di Qwen-VL dan versi chatnya Qwen-VL-Chat di open-source, yang dapat memahami informasi visual dan melakukan tugas visual.
Alibaba Cloud menjelaskan, model LLM open-source, termasuk Qwen-7B, Qwen-14B, Qwen-VL dan versi yang disempurnakan untuk percakapan, telah diunduh lebih dari 1,5 juta kali di komunitas open-source model AI Alibaba Cloud, ModelScope dan Hugging Face sejak Agustus. ModelScope telah menjadi komunitas model AI terbesar di Cina, dengan lebih dari 2,8 juta pengembang aktif, dan lebih dari 100 juta unduhan model hingga saat ini.
Eksplorasi konten lain dari Gizmologi.id
Berlangganan untuk dapatkan pos terbaru lewat email.




