Baidu Deep Voice 3 her aksanı taklit etmeyi öğrenebiliyor

Çinli arama devi Baidu, yılın ilk günlerinde Deep Voice adını verdiği sisteminin duyurusunu yapmıştı. Derin öğrenme teknolojisinden yararlanan sistem ile yazı konuşmaya dönüştürülebiliyor. Mayıs ayında tanıtılan Deep Voice 2’nin ardından Baidu Deep Voice 3 ile yeteneklerini geliştirmeyi sürdürüyor.

Deep Voice’un ilk versiyonu kısa cümleleri, gerçek bir insandan pek de farkı olmayan bir sesle söyleyebiliyordu. Her seferinde bir sesi tanıyabilen Deep Voice’u farklı seslerde eğitebilmek için çok uzun bir süre gerekiyordu. Mayıs ayında duyurulan Deep Voice 2’de ise bu süre yarım saate inmişti. Yenilenen sistem, yüzlerce farklı aksanı da öğrenebilir hâle gelmişti.

Baidu’nun yeni duyurduğu Deep Voice 3 ise sistemin nihai versiyonu olma niteliğini taşıyor. Şirketten yapılan açıklamada yeni versiyonun 2500 farklı sesi tanıyabildiği ve bunun için her sese sadece 30 dakikalık bir süre ayırmanın yeterli olduğu belirtildi.

Baidu’nun duyurusunda farklı sesleri türetebilen bir sistemin varlığının çok sayıda kapıyı açtığına ve başka zamanlarda uygulanabilir olmayan senaryoları uygulanabilir kıldığına dikkat çekildi. Baidu’nun geliştirdiği sistem sayesinde sesli bir kitaptaki tüm karakterler başka bir sesle konuşabiliyor. Böylelikle kullanıcı deneyiminin gelişmesi mümkün hâle geliyor.

Baidu Deep Voice 3 sentetik sesler üretiyor

Baidu Deep Voice 3 tarafından üretilen sesler, sistemin önceki versiyonlarından farklı olarak, kulağa sentetik geliyor. Şirketten yapılan açıklamada, nihai amacın sentetik sesler olmadığının altı çizildi. Baidu, sadece bir veya iki farklı ses üretmediğini hatırlattı. Şirket taklit edilen aksan ve ses sayısı arttıkça sentetik tınının arttığını, ancak gelecekte bu durumun düzeltilmesi için çalışıldığını belirtti.

Baidu Deep Voice 3 her aksanı taklit etmeyi öğrenebiliyor

Baidu Deep Voice 3 sentetik sesler üretiyor

Google, ABD’nin yapay zekâ eylem planı için tavsiyelerini sundu

SoftBank, Japonya’da OpenAI iş birliği için 676 milyon dolara eski Sharp fabrikasını satın aldı

Çin, yapay zekâ girişimi DeepSeek’e yönelik denetimleri sıkılaştırıyor

Google’ın yeni Gemini AI modeli ile filigranlar kolayca kaldırılabiliyor

Google, Gemini 2.0 modelini yaygın kullanıma açtı

ChatGPT, Android kullanıcılarının varsayılan asistanı olabiliyor

Huawei Mate X6 İncelemesi

Avrupa teknoloji sektörü, dijital egemenlik için radikal adımlar talep ediyor

Realme P3, Snapdragon 6 Gen 4 ve Mecha tasarımıyla tanıtıldı

Çin, yapay zekâ girişimi DeepSeek’e yönelik denetimleri sıkılaştırıyor

Apple, iPhone 17 Pro Max yerine iPhone 17 Ultra modelini tanıtabilir

FIRSATLAR

Anker markalı iki ürün için Hepsiburada’da indirim kuponları var

A101 13 Mart 2025 elektronik ürünleri arasında Galaxy S24 FE öne çıkıyor

Samsung 65Q80DK TV, Amazon’da 2.700 TL indirimle satışta

Samsung Galaxy S25+ ve diğer seçili telefonlarda 2000 TL’ye varan indirim imkanı

MediaMarkt’ta VESTEL 70QA9700 Android QLED TV fiyat avantajıyla sunuluyor

İNCELEMELER

Huawei Mate X6 İncelemesi

Bilgisayar gibi tablet: Huawei MatePad Pro 13.2 PaperMatte Edition İncelemesi

Huawei FreeArc İncelemesi

Vivo V50 İncelemesi

Redmi Note 14 Pro 4G İncelemesi

Baidu Deep Voice 3 sentetik sesler üretiyor

İLGİLİ HABERLER