![]() |
| foto (ist) |
SANTA CLARA, California (IndonesiaTerkini.com)- AMD (NASDAQ: AMD) mengumumkan bahwa Zyphra telah mencapai tonggak penting dalam pelatihan model AI berskala besar dengan pengembangan ZAYA1, model fondasi Mixture-of-Experts (MoE) pertama yang dilatih menggunakan platform GPU dan jaringan AMD. Dengan memanfaatkan GPU AMD Instinct™ MI300X, jaringan AMD Pensando™, serta open software AMD ROCm™, pencapaian ini dijelaskan dalam laporan teknis Zyphra yang diterbitkan hari ini.
Hasil Zyphra menunjukkan bahwa model ini memberikan kinerja kompetitif atau lebih unggul dibandingkan model terbuka terkemuka dalam tolok ukur penalaran, matematika, dan pemrograman—mendemonstrasikan skalabilitas dan efisiensi GPU AMD Instinct untuk beban kerja AI produksi berskala besar.
“Kepemimpinan AMD dalam komputasi terakselerasi memberdayakan inovator seperti Zyphra untuk mendorong batas kemungkinan dalam AI,” kata Emad Barsoum, corporate vice president of AI and engineering, Artificial Intelligence Group, AMD. “Tonggak ini menunjukkan kekuatan dan fleksibilitas GPU AMD Instinct dan jaringan Pensando untuk melatih model kompleks berskala besar.”
“Efisiensi selalu menjadi prinsip utama di Zyphra. Hal ini membentuk cara kami merancang arsitektur model, mengembangkan algoritme pelatihan dan inferensi, serta memilih perangkat keras dengan rasio harga-kinerja terbaik untuk menghadirkan kecerdasan frontier kepada pelanggan kami,” ujar Krithik Puthalath, CEO of Zyphra. “ZAYA1 mencerminkan filosofi ini dan kami bangga menjadi perusahaan pertama yang mendemonstrasikan pelatihan berskala besar di platform AMD. Hasil kami menyoroti kekuatan co-design arsitektur model dengan silikon dan sistem, dan kami bersemangat memperdalam kolaborasi dengan AMD dan IBM dalam membangun generasi berikutnya dari model fondasi multimodal canggih.”
Pelatihan Efisien Berskala Besar, Didukung GPU AMD Instinct
GPU AMD Instinct MI300X dengan 192 GB memori bandwidth tinggi memungkinkan pelatihan berskala besar secara efisien, menghindari kebutuhan sharding ahli atau tensor yang mahal, sehingga mengurangi kompleksitas dan meningkatkan throughput di seluruh tumpukan model. Zyphra juga melaporkan waktu penyimpanan model lebih dari 10x lebih cepat dengan menggunakan I/O terdistribusi yang dioptimalkan AMD, sehingga semakin meningkatkan keandalan dan efisiensi pelatihan. Dengan hanya sebagian kecil parameter aktif, ZAYA1-Base (8,3B total, 760M aktif) menyamai atau melampaui kinerja model seperti Qwen3-4B (Alibaba), Gemma3-12B (Google), Llama-3-8B (Meta), dan OLMoE.
Melanjutkan kerja sama sebelumnya, Zyphra dengan AMD dan IBM untuk merancang serta menerapkan kluster pelatihan berskala besar yang didukung GPU AMD Instinct™ dengan interkoneksi jaringan AMD Pensando™. Sistem hasil rekayasa bersama AMD dan IBM, yang diumumkan pada kuartal ini, menggabungkan GPU AMD Instinct™ MI300X dengan fabric dan arsitektur penyimpanan berperforma tinggi milik IBM Cloud, menyediakan fondasi bagi pretraining berskala besar ZAYA1. (red/dri)
Thanks for reading AMD Dukung Frontier AI Training untuk Zyphra. Please share...!
