Untuk memudahkan pemahaman, model AI saat ini berada dalam fase pra-pelatihan, yang berarti belum dilatih cukup untuk memberikan hasil yang diinginkan.
Ini adalah tahap ketika algoritma dan arsitektur AI digunakan untuk merancang alur kerja model dan bagaimana ia memproses data, akhirnya.
Baca Juga: Apple dan Google Berkolaborasi: Gemini AI Menuju iPhone!
Tim peneliti Apple berhasil menambahkan visi komputer ke model tersebut menggunakan pengkode gambar dan penghubung bahasa visi.
Kemudian, saat diuji dengan campuran hanya gambar, gambar dan teks, dan kumpulan data hanya teks, tim menemukan bahwa hasilnya kompetitif dibandingkan dengan model yang ada pada tahap yang sama.
Meskipun terobosan ini signifikan, makalah penelitian ini tidak cukup untuk memastikan bahwa chatbot AI multimodal akan ditambahkan ke sistem operasi Apple.
Baca Juga: Inilah Negara-negara yang Dipilih Apple untuk Peluncuran Vision Pro Terbaru
Pada tahap ini, sulit bahkan untuk mengatakan apakah model AI multimodal saat mengambil masukan atau dalam memberikan keluaran juga (apakah dapat menghasilkan gambar AI atau tidak).
Namun, jika hasilnya terbukti konsisten setelah melalui penelaahan oleh rekan sejawat, dapat dikatakan bahwa raksasa teknologi ini telah mengambil langkah besar lainnya menuju pembangunan model dasar AI generatif bawaan.***