
Sebuah ilustrasi menunjukkan miniatur taman bermain anak-anak di depan logo Meta, 4 April 2023. (Reuters)
reporter-channel – Perusahaan induk Facebook, Meta Platforms, pada hari Selasa (22/8/2023) merilis model Artificial Intelligence (AI) atau kecerdasan buatan yang mampu menerjemahkan dan mentranskripsikan ucapan dalam puluhan Bahasa.
Sebuah rintisan awal yang potensial dari sebuah alat yang memungkinkan komunikasi real-time melintasi perbedaan bahasa.
Perusahaan mengatakan dalam sebuah posting blog bahwa model SeamlessM4T-nya dapat mendukung terjemahan antara teks dan ucapan dalam hampir 100 bahasa, serta terjemahan ucapan-ke-ucapan penuh untuk 35 bahasa, menggabungkan teknologi yang sebelumnya hanya tersedia dalam model yang terpisah.
CEO Meta, Mark Zuckerberg membayangkan alat tersebut memfasilitasi interaksi antara pengguna dari seluruh dunia di metaverse, sebuah dunia virtual yang saling terhubung di mana dia mempertaruhkan masa depan perusahaan.
Meta menyediakan model ini untuk publik untuk penggunaan non-komersial, kata postingan blog tersebut.
Perusahaan media sosial terbesar di dunia ini telah merilis sejumlah model AI yang sebagian besar gratis tahun ini, termasuk model bahasa besar yang disebut Llama yang menjadi tantangan serius bagi model-model berpemilik yang dijual oleh OpenAI yang didukung oleh Microsoft dan Google milik Alphabet.
Zuckerberg mengatakan bahwa ekosistem AI terbuka akan menguntungkan Meta, karena perusahaan memiliki lebih banyak keuntungan dengan secara efektif melakukan crowd-sourcing untuk menciptakan alat yang dapat digunakan oleh konsumen untuk platform sosialnya dibandingkan dengan memungut biaya untuk akses ke model-model tersebut.
Meskipun demikian, Meta menghadapi pertanyaan hukum yang serupa dengan industri lainnya seputar data pelatihan yang digunakan untuk membuat modelnya.
Untuk model SeamlessM4T, para peneliti Meta mengatakan dalam sebuah makalah penelitian bahwa mereka mengumpulkan data pelatihan audio dari 4 juta jam “audio mentah yang berasal dari repositori data web yang dirayapi yang tersedia untuk umum,” tanpa menyebutkan repositori mana.
Juru bicara Meta tidak menanggapi pertanyaan tentang asal usul data audio tersebut.
Data teks berasal dari kumpulan data yang dibuat tahun lalu yang mengambil konten dari Wikipedia dan situs web terkait, kata makalah penelitian tersebut.
Sumber: Reuters