(SeaPRwire) – Singapura, 11 Agustus 2025 — Pada 12 Agustus, Skywork AI mengumumkan rilis Matrix-Game 2.0, versi yang ditingkatkan dari model dunia interaktif seri Matrix-nya. Model terobosan ini menghadirkan generasi video interaktif sekuens panjang secara real-time di seluruh skenario serbaguna, dan model ini sepenuhnya open-source, menjadikannya yang pertama di industri.
Matrix-Game 2.0 merepresentasikan lompatan besar dalam kinerja real-time maupun kemampuan generasi sekuens panjang. Dengan fokus pada latensi rendah dan kecepatan bingkai tinggi, model ini dapat secara stabil menghasilkan video berkelanjutan pada 25 FPS di berbagai lingkungan kompleks, dengan durasi yang mencapai hitungan menit. Hasilnya adalah peningkatan koherensi, kegunaan, dan imersi yang signifikan.
Selain inferensi yang lebih cepat, Matrix-Game 2.0 mempertahankan pemahaman yang tepat tentang fisika dan semantik adegan. Pengguna dapat mengeluarkan perintah sederhana untuk menjelajahi, memanipulasi, dan membangun lingkungan virtual yang konsisten secara struktural, kaya secara visual, dan masuk akal secara logis secara real-time. Terobosan ini menghilangkan batasan antara generasi konten dan keterlibatan interaktif, membuka kemungkinan baru untuk aplikasi dalam manusia virtual, mesin game, AI terwujud, dan banyak lagi.
Arsitektur Model
Matrix-Game 2.0 memperkenalkan pendekatan berbasis visi baru untuk pemodelan dunia interaktif—bergeser dari ketergantungan perintah bahasa dan berfokus pada pemahaman spasial dan pembelajaran berbasis fisika.
- Kompresi VAE Kausal 3D: Mengompresi dimensi spasial dan temporal secara efisien untuk pemodelan dan generasi yang lebih baik.
- Transformer Difusi Multimodal (DiT): Menggabungkan pengodean visi dengan perintah aksi pengguna untuk menghasilkan urutan dinamis yang realistis bingkai demi bingkai.
- Modul Interaksi Pengguna: Mengadaptasi kerangka kerja GameFactory dan Genie-style untuk memungkinkan kontrol real-time.
Generasi Video Autoregresif Real-Time
Menggunakan strategi pelatihan Self-Forcing, Matrix-Game 2.0 menggunakan mekanisme generasi difusi autoregresif baru untuk mengatasi latensi dan akumulasi kesalahan dalam model konvensional:
- Distilasi Model Difusi Kausal: Meminimalkan penundaan sekuens dengan pengondisian pada bingkai sebelumnya.
- Distilasi Pencocokan Distribusi (DMD): Menyelaraskan distribusi pelatihan dan inferensi untuk hasil yang lebih stabil.
- Mekanisme KV Cache: Memungkinkan generasi video panjang yang mulus tanpa komputasi berlebihan, mendukung panjang output tak terbatas pada 25 FPS pada satu GPU.
Aplikasi & Kinerja
Matrix-Game 2.0 mendukung interaksi dinamis yang konsisten secara fisik—seperti pergerakan karakter dan rotasi kamera—melalui input keyboard dan mouse. Ini berlaku untuk berbagai adegan, termasuk lingkungan GTA-style, Minecraft, dan eksplorasi dunia terbuka, dengan adaptasi lintas domain yang ditingkatkan dan realisme fisik.
Tiga Terobosan Inti:
- Generasi Sekuens Panjang Real-Time FPS Tinggi: Interaksi responsif, alami, dan berdurasi menit pada 25 FPS.
- Generalisasi Multi-Adegan: Dapat beradaptasi dengan berbagai gaya dan lingkungan, dari pemandangan kota hingga rendering artistik.
- Konsistensi Fisik yang Ditingkatkan: Pergerakan realistis di medan yang kompleks, meningkatkan imersi dan kemampuan kontrol.
Matrix-Game 2.0 menetapkan tonggak baru untuk penelitian dan aplikasi intelijen spasial, membuka jalan bagi pelatihan AI terwujud, konstruksi dunia virtual yang cepat, dan pembuatan konten untuk film dan metaverse.
Tautan Open-Source:
- Laporan Teknis:
- Halaman Proyek:
- HuggingFace:
- GitHub:
adalah ruang kerja AI yang berorientasi konsumen dan platform kreatif yang membantu pengguna sehari-hari menghasilkan slide, spreadsheet, video, dokumen, dan konten interaktif dalam hitungan menit – dibangun di sekitar alur kerja percakapan yang intuitif. Platform ini menawarkan panduan prompt, pratinjau real-time, dan integrasi dengan alat kantor umum untuk mempercepat alur kerja bagi siswa, pekerja lepas, dan tim kecil. Tersedia di web dan seluler, menekankan kemudahan penggunaan, keterjangkauan, dan iterasi cepat—membawa alat kreativitas AI canggih langsung ke konsumen.
Artikel ini disediakan oleh penyedia konten pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberikan jaminan atau pernyataan sehubungan dengan hal tersebut.
Sektor: Top Story, Daily News
SeaPRwire menyediakan distribusi siaran pers real-time untuk perusahaan dan lembaga, menjangkau lebih dari 6.500 toko media, 86.000 editor dan jurnalis, dan 3,5 juta desktop profesional di 90 negara. SeaPRwire mendukung distribusi siaran pers dalam bahasa Inggris, Korea, Jepang, Arab, Cina Sederhana, Cina Tradisional, Vietnam, Thailand, Indonesia, Melayu, Jerman, Rusia, Prancis, Spanyol, Portugis dan bahasa lainnya.
KONTAK: Peter Tian Skywork AI PTE.LTD. peter (at) skywork.ai