Teknoloji

Kuaishou, KLING modeli ile video üretiminde Sora’ya ciddi bir rakip çıkarıyor

kling

Yapay zeka alanında yaşanan gelişmeler, teknoloji dünyasının sınırlarını her geçen gün genişletiyor. Bu yenilikler arasında, video üretimi konusunda hayal gücümüzü zorlayan bir model de Çin’den geldi. TikTok’un Çin’deki rakibi olan Kuaishou, OpenAI’nin henüz geniş kitlelerin kullanımına sunulmamış Sora modeline benzer, ancak birçok açıdan daha iyi performans sergileyen açık erişimli yeni bir model olan KLING’i geliştirdi. KLING isimli bu model, metinlerden neredeyse gerçekçi videolar oluşturabilme yeteneğine sahip.

KLING ile yapay zekâ destekli video yapımında yeni bir soluk

Bir Çinli adamın masada oturup çubuklarla erişte yediği basit bir betimlemeyle, KLING modeli, geçen yıl Modelscope Text2Video tarafından yaratılan ve Will Smith’in demonik görünümlü erişte videosuyla kıyaslandığında, neredeyse gerçekçi bir video üretmeyi başardı.

KLING, tek bir komutla 1080p kalitesinde, saniyede 30 kare (fps) hızında 2 dakika uzunluğunda videolar üretebiliyor. Gerçek dünyadaki fiziksel özellikleri doğru bir şekilde simüle edebiliyor. Diffusion Transformer mimarisi kullanan KLING, zengin metin betimlemelerini canlı sahnelere çeviriyor. Özel 3D VAE desteği ve değişken çözünürlük eğitimi ile çeşitli en-boy oranlarını destekleyen model, gelişmiş 3D yüz ve vücut yeniden yapılandırma teknolojisi ile, tek bir tam vücut fotoğrafından tam ifade ve uzuv hareketi sürükleme imkanı sunuyor.

Çin’in yapay zeka modelleri geliştirme konusunda dünya liderleri arasında yer almakta olduğu açık. Şu anda açık erişimde olan KLING, ülkenin bu alanda ne kadar ileri gittiğinin sadece bir örneğini sunuyor.

OpenAI, yıl sonuna kadar Sora’yı kullanıma sunmayı planladığını duyurdu ancak, Çin’in metinden videoya dönüşüm modelleri karşısında bu çabanın yeterli olup olmayacağı tartışılıyor. Bu yarışta OpenAI’ın en büyük avantajı, Çin’in modelini dünya çapında erişime açmama ihtimali olabilir.

İlginç bir şekilde, KLING, Çin’den çıkan ilk video üretim modeli değil. Nisan ayında piyasaya sürülen Vidu AI, 1080p çözünürlükle 16 saniye uzunluğunda videolar oluşturabilen, Sora’nın Çin versiyonu olarak kabul edilen ilk modeldi.

Bu teknolojik ilerlemeler, yapay zekâ destekli yaratıcılığın sınırlarını genişletiyor ve gelecekte içerik üretiminin nasıl şekilleneceğine dair heyecan verici ipuçları sunuyor.