Meta, çeviri dünyasında dev bir adım attı ve neredeyse 100 dili destekleyen yeni bir konuşma-metne çeviri modeli olan SeamlessM4T’yi duyurdu. Şirket, evrensel bir çevirmen yaratma çabalarını sürdürürken, bu yeni model, işleri bir adım öteye taşıyor.
SeamlessM4T, yani Kitlesel Çok Dilli ve Çok Yönlü Makine Çevirisi, neredeyse 100 dili metne ve metinden metne çevirebilme kapasitesine sahip. Konuşma-konuşmaya ve metin-konuşmaya dönüştürme işlemleri için, 100 girdi dilini tanır ve bunları 35 çıktı diline dönüştürür.
Creative Commons CC BY-NC 4.0 lisansı altında sunulan bu model, araştırmacıların üzerinde çalışmalarına izin veriyor. Meta, ayrıca açık çeviri veri seti SeamlessAlign için de metaveri yayınladı.
“‘Galaksinin Otostopçu Rehberi’nde yer alan hayali Babel Balığı gibi evrensel bir dil çevirmeni oluşturmanın zorluğu, mevcut konuşma-konuşma ve konuşma-metin sistemlerinin dünya dillerinin sadece küçük bir bölümünü kapsamasından kaynaklanıyor.” diye açıklıyor Meta.
SeamlessM4T, diğer büyük çeviri modellerinin aksine, çeviri görevini tek seferde gerçekleştirdiği için “önemli bir atılım” olarak nitelendiriliyor.
Bu modelin ilginç özelliklerinden biri, doğru işlev gördüğünde, bir konuşmacının kod değiştirmesini veya bir cümlenin içinde iki veya daha fazla dil arasında geçiş yaptığını tanıma yeteneği. Örneğin, Meta, bir videoda modelin hemen Hintçe, Telugu ve İngilizce arasındaki farkı ayırt ettiğini gösterdi.
SeamlessM4T, Meta’nın daha önceki çeviri modelleri üzerine kuruluyor. Geçtiğimiz yıl Meta, 200 dil destekleyen No Language Left Behind metinden metine makine çeviri modelini duyurmuştu. Çok dilli konuşma-konuşma çevirisi ve konuşma tanıma için Veri setleri geliştirdi. Meta, geçen yıl Çin’de yaygın olarak kullanılan resmi bir yazım sistemine sahip olmayan Hokkien dilinde konuşulan bir metni İngilizce’ye çeviren Universal Speech Translator’ını tanıtmıştı.
Dil çevirisi, farklı dillerdeki Facebook ve Instagram gönderilerini denetlemekle binlerce kişiyi istihdam eden Meta gibi şirketler için önemli. Çok sık olarak, ana dillerdeki küçük ekipler, bu dillerle kötü çalışan otomatik denetimlere güvenmek zorunda kalıyor. Yapay zeka, bu küçük dillere erişim verildiğinde, şirketlerin denetimini geliştirmek için bir araç olabilir.
SeamlessM4T’yi oluştururken, Meta Fairseq dizilim modelleme araç setini yeniden tasarladığını ve daha hafif modeller yaratmak ve daha fazla bilgi işlemek için kullandığını belirtiyor.
Geliştirme aşamasında, Meta, toksik veya hassas kelimeleri tanıyan bir sistem inşa etti. Toksik kelimeleri, “çevirinin nefret, şiddet, küfür veya tacize teşvik edebileceği durumlar” olarak tanımlıyor.
Meta, ayrıca dillerdeki cinsiyet önyargısını tanıdığını ve modelin çevirilerdeki cinsiyet önyargısını nicel olarak ölçebileceğini iddia ediyor. Örneğin, İspanyolca’da bir kelimenin cinsiyetleşmiş bir biçimi olan “doctora” kullanıldıysa, hedef dilde eşdeğer bir cinsiyetleşmiş dil bilgisi olmadan kadın zamiri atayabilir.
Meta, AI modellerinin birçoğunu geliştiricilere ve araştırmacılara daha çok açık kaynak tarzında sunmaktadır. Yakın zamanda metinden sese dönüşüm sağlayan AudioCraft kodunu yayınladı. Ayrıca Meta, büyük dil modeli Llama 2’ye de erişim sağladı.