Yapay zeka alanında öncü şirketlerden biri olan OpenAI, metin talimatlarından gerçekçi ve hayal ürünü sahneler yaratabilen yeni bir video üretim modeli olan Sora‘yı duyurdu. Kullanıcıların yazdıkları komutlara dayanarak bir dakikaya kadar fotoğraf gerçekçiliğinde videolar oluşturabilen OpenAI Sora yazıdan-video modeli, teknoloji ve yaratıcılığı bir araya getiriyor.
Sora’nın yenilikçi özellikleri
Sora, çok karakterli karmaşık sahneler, belirli hareket türleri ve konu ile arka planın doğru detayları dahil olmak üzere, geniş bir yaratıcılık yelpazesine imkan tanıyor. OpenAI’nin tanıtım blog gönderisine göre, model nesnelerin fiziksel dünyada nasıl var olduğunu anlayabiliyor, aksesuarları doğru bir şekilde yorumlayabiliyor ve canlı duyguları ifade eden etkileyici karakterler üretebiliyor.
Sora ile oluşturulan demolar arasında, altın çağında Kaliforniya’nın havadan çekilmiş bir sahnesi, Tokyo’nun içinden bir tren gibi görünen bir video ve diğerleri yer alıyor. Ancak, OpenAI karmaşık bir sahnenin fiziksel simülasyonunu doğru bir şekilde gerçekleştirmede modelin zorlanabileceğini belirtiyor.
Son zamanlarda, Runway ve Pika gibi şirketler kendi metinden-videoya modelleriyle dikkat çekerken, Google’ın Lumiere’i de bu alanda OpenAI’nin başlıca rakiplerinden biri olarak öne çıkıyor. Sora’ya benzer şekilde, Lumiere kullanıcılara metinden video oluşturma araçları sunuyor ve ayrıca bir sabit görüntüden video yaratma imkanı veriyor.
Şu an için OpenAI Sora, modelin potansiyel zararları ve riskleri değerlendiren “kırmızı takım” üyelerine sunulmuş durumda. Öte yandan OpenAI, geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sağlıyor. Şirket, mevcut modelin karmaşık bir sahnenin fiziksel yasalarını doğru bir şekilde yeniden oluşturamayabileceğini ve belirli neden-sonuç örneklerini doğru şekilde yorumlayamayabileceğini not düşüyor.
OpenAI, diğer AI ürünleri gibi, yapay zekâ ile üretilmiş videoların gerçek zannedilmesinin sonuçlarıyla başa çıkmak zorunda kalacak. Bu bağlamda, şirket bu ayın başlarında metinden resim aracı DALL-E 3’e filigran eklediğini, ancak bunların “kolayca çıkarılabileceğini” belirtmişti. Sora, sadece teknoloji ve sanat dünyasında değil, etik ve toplumsal düzeyde de önemli tartışmaları beraberinde getiriyor.