Google DeepMind ses efektleri ve diyalog teknolojisini gösterdi

Google’ın yapay zeka laboratuvarı DeepMind, videolar için ses efektleri ve diyaloglar oluşturabilen yeni bir teknoloji geliştirdiğini açıkladı. Bu yenilikçi teknoloji, videoların ham piksellerini ve metin girdilerini kullanarak, görsel sahnelere uygun ses efektleri yaratabiliyor. DeepMind ekibi, bu projeyi “video-ile-ses” (V2A) teknolojisi olarak adlandırdı ve bu teknoloji, Google Veo ve OpenAI Sora gibi diğer video oluşturma araçlarıyla birlikte kullanılabiliyor.

Google DeepMind’ın Video-İle-Ses teknolojisi

DeepMind ekibi, blog yazılarında bu teknolojinin işleyişi hakkında detaylı bilgi verdi. Sistem, videoların ham piksellerini analiz ederek bu görsel veriyi metin girdileri ile birleştiriyor ve böylece ekranda olup bitenlere uygun ses efektleri oluşturabiliyor. Bu özellik, geleneksel sesli film ve sessiz film gibi farklı video türlerine de uygulanabiliyor.

Teknolojinin eğitimi, video, ses ve yapay zeka tarafından oluşturulan detaylı ses ve diyalog açıklamaları içeren anotasyonlar ile gerçekleştirildi. Bu sayede, teknoloji görsel sahneler ile spesifik sesleri ilişkilendirmeyi öğrendi. Bu özellik, DeepMind’ın mevcut video-ile-ses çözümlerinden farklı olmasını sağlıyor çünkü sistem, ham pikselleri anlayabiliyor ve metin girdisi eklemek isteğe bağlı.

Metin girdisi isteğe bağlı olsa da, kullanıcılar metin girdisi kullanarak nihai ürünü daha da şekillendirebiliyor ve daha gerçekçi ve doğru ses efektleri oluşturabiliyor. Pozitif girdiler kullanılarak istenen seslerin oluşturulması sağlanırken, negatif girdiler ile istenmeyen seslerden kaçınılabilir. Örneğin, “sinematik, gerilim, korku filmi, müzik, gerginlik, beton üzerinde ayak sesleri” gibi bir girdi kullanıldığında, sistem bu girdiye uygun sesler üretebiliyor.

Araştırmacılar, V2A teknolojisinin mevcut sınırlamaları üzerinde çalıştıklarını kabul ediyorlar. Örneğin, kaynak videoda bozulmalar olduğunda, çıkış sesinin kalitesinde düşüş yaşanabiliyor. Ayrıca, oluşturulan diyalogların dudak senkronizasyonu üzerinde de geliştirmeler yapılması gerekiyor. DeepMind ekibi, teknolojinin piyasaya sürülmeden önce titiz güvenlik değerlendirmeleri ve testlerden geçirileceğini de taahhüt ediyor.

Sonuç olarak, DeepMind’ın bu yeni teknolojisi, videolar için ses efektleri ve diyaloglar oluşturma sürecinde devrim niteliğinde bir adım olabilir. Bu teknoloji, video prodüksiyon süreçlerini daha verimli ve yaratıcı hale getirebilir, aynı zamanda sessiz filmleri ve diğer geleneksel video türlerini de yeniden canlandırabilir. DeepMind’ın bu yenilikçi çalışması, yapay zekanın medya ve eğlence sektöründeki potansiyelini bir kez daha gözler önüne seriyor.

Google DeepMind yeni teknolojisiyle videolar için ses efektleri ve diyalog oluşturuyor

Google DeepMind’ın Video-İle-Ses teknolojisi

Android 15, Samsung güncellemeleri öncesinde cihazların yüzde 4,5’ine ulaştı

OpenAI, ChatGPT’nin derin araştırma aracını tüm kullanıcılara açtı

Microsoft en yeni Surface reklamını yapay zekâ ile hazırladı

ChatGPT’ye daha az kaynak tüketen araştırma özelliği geldi

Google’ın parçalanması internetin dengesini yeniden kurabilir

Google’ın yapay zekâlı arama özeti her ay 1,5 milyar kullanıcıya ulaşıyor

Tesla Model Y SR Türkiye’de satışa çıktı, fiyatı 1.909.116 TL olarak belirlendi

Volvo EX30’un Avrupa’daki üretimi Türkiye pazarını da doğrudan etkiliyor

Kaitlin Olson’ın başrolünde yer aldığı “High Potential” tüm bölümleriyle Disney+’ta yayında

Netflix, “Kimler Geldi Kimler Geçti” dizisinin yeni sezon yayın tarihini açıkladı

Wednesday’in ikinci sezonu iki kısım halinde yayınlanacak

FIRSATLAR

Galaxy Watch Ultra, A101 24 Nisan 2025 elektronik ürünleri içinde dikkat çekiyor

LEGO oyun setlerinde 23 Nisan’a özel indirimler Hepsiburada’da başladı

HP OMEN 16-K0008NT modeli Amazon ve Hepsiburada’da yaklaşık 3.000 TL indirimde

Nintendo Switch OLED, A101’de 13.399 TL’ye satışta

Honor X9b ve Redmi Note 14 A101 17 Nisan 2025 kataloğunda

İNCELEMELER

Asus ZenBook A14 İncelemesi

Oppo Reno13 F 5G İncelemesi

Huawei Mate X6 İncelemesi

Bilgisayar gibi tablet: Huawei MatePad Pro 13.2 PaperMatte Edition İncelemesi

Huawei FreeArc İncelemesi

Google DeepMind’ın Video-İle-Ses teknolojisi

İLGİLİ HABERLER