OpenAI, yapay zekâ destekli sohbet platformu ChatGPT’nin Gelişmiş Ses Modu (AVM) üzerine yaptığı önemli bir güncellemeyi duyurdu. Bu yeni özellikler, kullanıcıların telefon kameralarını ve ekran paylaşımı işlevlerini kullanarak ChatGPT ile daha etkileşimli bir şekilde iletişim kurmasını sağlıyor. Özellikle görsel ve ekran üzerinden bilgi paylaşımı yapabilme yeteneği, ChatGPT’nin kullanım alanını genişletiyor. Artık kullanıcılar, cihazlarının kameralarını belirli bir nesneye yönelterek veya ekranlarındaki içerikleri paylaşarak yapay zekânın bu bilgileri anlamasını ve yanıt vermesini sağlayabiliyor.
Yeni tanıtılan özellikler, ChatGPT Plus ve Pro abonelik sahipleri için erişime açıldı. Eğitim ve kurumsal müşterilere yönelik sunumun ise 2025 yılının Ocak ayı içinde başlaması bekleniyor. OpenAI’ın bu adımı, yapay zekâ destekli asistanların günlük yaşamın farklı alanlarında nasıl daha işlevsel hale getirilebileceğini gözler önüne seriyor. Ayrıca, video ve ekran paylaşımı gibi yeniliklerin iş ve eğitim alanlarında yaratacağı etkiler de şimdiden merak konusu.
ChatGPT görsel modlar ile daha kapsamlı etkileşim kuruyor
OpenAI, bu özellikleri bir canlı yayın sırasında tanıttı. Şirketin Ürün Sorumlusu Kevin Weil ve ekibi, ChatGPT’nin görsel yeteneklerini kullanarak bir pour-over kahve yapım sürecini adım adım gerçekleştirdi. Bu süreçte, yapay zekâ modeli, bir kahve makinesini analiz ederek kahve hazırlama adımlarını başarıyla açıklayabildi. Bunun yanında, ekran paylaşımı özelliğiyle bir telefon ekranındaki mesajı anlayarak kullanıcıya yönlendirme sağladı.
Tüm bu özelliklerin yanı sıra, kullanıcıların dikkatini çeken bir diğer detay da yapay zekâ destekli ses modunda Noel Baba sesi seçeneğinin tanıtılması oldu. Uygulamadaki bir kar tanesi ikonuna dokunarak aktif hale getirilen bu seçenek, eğlenceli bir deneyim sunuyor. Bununla birlikte, bu ses seçeneğinin yalnızca 13 yaş ve üzeri kullanıcılar için uygun olduğu belirtiliyor. OpenAI’ın bu tarz küçük dokunuşları, yapay zekâ teknolojisinin daha erişilebilir ve kullanıcı dostu hale gelmesi adına önemli bir adım olarak değerlendiriliyor.
ChatGPT’nin video ve ekran paylaşımı gibi işlevsel yeniliklerle donatılması, Google’ın geçtiğimiz günlerde duyurduğu Gemini 2.0 modeliyle girdiği rekabetin bir sonucu olarak yorumlanıyor. Gemini 2.0, hem görsel hem de işitsel verileri işleyebilme yeteneğine sahip olup, çok adımlı görevleri kullanıcı adına yerine getirebiliyor. Bu modelin “Project Astra”, “Project Mariner” ve “Project Jules” adlarıyla farklı kullanıcı senaryoları için test edildiği biliniyor.
Bu bağlamda, OpenAI’ın ChatGPT’ye eklediği görsel ve ekran paylaşımı yetenekleri, rekabetin yoğun olduğu yapay zekâ pazarında dikkat çekici bir hamle olarak değerlendiriliyor. Özellikle günlük hayatta pratik fayda sağlayan bu tür özellikler, yapay zekâ destekli platformların yalnızca bilgi sunmakla kalmayıp, daha kapsamlı bir kullanıcı deneyimi sunabileceğini kanıtlıyor.
ChatGPT’nin görsel analiz ve ekran paylaşımı işlevlerinin, bireysel kullanıcıların yanı sıra iş dünyası ve eğitim sektöründe geniş bir kullanım alanı bulması bekleniyor. Özellikle görsel içeriklerin analiz edilmesi, iş süreçlerinde zaman kazandırıcı bir etken olarak öne çıkabilir. Aynı şekilde, eğitimde, öğrencilerin görsel materyalleri anında yorumlayabilmesi veya karmaşık bilgileri yapay zekâ yardımıyla sadeleştirebilmesi mümkün hale geliyor.