Nvidia, Fugatto adını taşıyan yapay zeka destekli yeni ses düzenleme aracını tanıttı. Şirket, Fugatto’nun daha önce duyulmamış sesler ve müzikler oluşturma kapasitesine sahip olduğunu belirtiyor.
Fugatto, metin ve ses girdilerini kullanarak müzik, ses efektleri ve konuşma üretebiliyor. Örneğin, “saksafon uluması, havlayan köpek sesleriyle elektronik müzik” gibi alışılmadık talimatlara dayalı parçalar oluşturabiliyor.
Nvidia, Fugatto’yu geliştirmek için milyonlarca ses örneğinden oluşan geniş bir veri seti kullandı. Bu veri seti, BBC’nin ses efektleri kütüphanesi gibi kaynakları içeriyor. Araştırmacılar, bu kapsamlı veri setiyle modelin görev çeşitliliğini artırmayı ve daha doğru sonuçlar elde etmeyi hedefledi.
Fugatto’nun yetenekleri arasında, kullanıcıların seslerini dönüştürme, aksanlarını değiştirme veya farklı tonlamalar ekleme bulunuyor. Ayrıca, şarkılardaki vokalleri izole etme, yeni enstrümanlar ekleme ve mevcut melodileri yeniden düzenleme gibi müzik düzenleme araçları da sunuyor.
Nvidia, Fugatto’nun halka ne zaman sunulacağı veya sunulup sunulmayacağı konusunda henüz net bir bilgi paylaşmadı. Ancak, şirketin iddiaları, Fugatto’nun rakiplerinden ayrıştığını gösteriyor. Günümüzde Stability AI, OpenAI, Google DeepMind, ElevenLabs ve Adobe gibi şirketler de yapay zeka tabanlı ses araçları geliştiriyor.
Yapay zeka ile müzik ve ses üretimi alanında telif hakları tartışmaları da gündemde. Bazı girişimler, yapay zeka destekli müzik araçları nedeniyle telif hakları davalarıyla karşı karşıya. Ayrıca Nvidia’nın ve diğer şirketlerin, YouTube videolarından alınan altyazılar gibi kaynaklarla yapay zeka modellerini eğittiği belirtiliyor.
Nvidia Fugatto ile müzik üretim sürecinde büyük bir değişimi tetikleyebilir
Fugatto gibi araçların, yaratıcı sektörlerde yeni fırsatlar sunmanın yanı sıra telif hakları ve etik konularında nasıl bir etki yaratacağı merak konusu. Nvidia’nın bu alandaki yenilikçi yaklaşımı, gelecekte ses tasarımı ve müzik üretimi süreçlerini kökten değiştirebilir.