Teknoloji

OpenAI, görsellerle akıl yürütebilen yeni modelleri o3 ve o4-mini’yi duyurdu

OpenAI GPT-4.1

OpenAI, çok modlu yapay zeka alanındaki çalışmalarını yeni iki modelle bir üst aşamaya taşıdı. o3 ve o4-mini adını taşıyan bu modeller, yalnızca metinleri değil, görselleri de düşünsel süreçlerine dahil edebiliyor. Şirket, o3’ü şimdiye kadarki en gelişmiş akıl yürütme modeli olarak tanımlarken, o4-mini’nin küçük yapısına rağmen etkili sonuçlar verdiğini belirtiyor. Bu iki model, GPT-4.1’in tanıtılmasından sadece günler sonra kamuoyuyla paylaşıldı.

Yeni modellerin temel farkı, görselleri işleyebilme ve bunlarla düşünsel bağlantılar kurabilme becerisine sahip olmaları. Kullanıcılar, bu modellere el çizimleri, şemalar veya dijital görseller göstererek analiz ettirebiliyor. Görüntüleri döndürmek ya da yakınlaştırmak gibi işlemler, modellerin düşünme sürecine dahil ediliyor. Bu sayede, yapay zekanın analiz alanı metnin dışına taşarak daha geniş bir kapsam kazanıyor.

ChatGPT araçlarına tam erişim sunan modeller yeteneklerini genişletiyor

OpenAI’ın yeni duyurduğu bu modeller, yalnızca görsellerle düşünmekle sınırlı kalmıyor. o3 ve o4-mini, ChatGPT ekosistemindeki tüm yardımcı araçlara da erişim sağlıyor. Web tarayıcısı, kod çalıştırma, görsel üretimi ve dosya analizi gibi özellikler artık bu modellerle birlikte kullanılabiliyor. Şirket, bu yeteneklerin şu an ChatGPT Plus, Pro ve Team kullanıcıları için aktif olduğunu belirtiyor.

Her ne olursa olsun, bu gelişme yalnızca yeni yetenekler kazandırmakla kalmıyor; aynı zamanda mevcut model yelpazesinde bir değişikliğe de işaret ediyor. o1, o3-mini ve o3-mini-high modelleri kademeli olarak sistem dışına çıkarılacak. Bu karar, kaynakların daha gelişmiş sistemlere yönlendirilmesini amaçlıyor olabilir. Kullanıcılar ise bu dönüşümün günlük kullanımda ne gibi etkiler yaratacağını zamanla gözlemleyecek.

OpenAI’ın bu modellerle hedeflediği temel noktalardan biri, görsel veriyle çalışma becerisi olan çok modlu yapay zeka kapasitesini geliştirmek. Bu modeller, yalnızca verilen komutları yanıtlamakla kalmayıp, görüntü üzerinden çıkarımlar yapabiliyor. Örneğin bir tasarım şeması, matematiksel bir tablo veya mimari çizim, artık daha derinlemesine yorumlanabiliyor. Böylece yapay zekanın analiz ve problem çözme gücü daha uygulanabilir hale geliyor.

Bunun yanı sıra, o3 ve o4-mini modelleri yalnızca teknik yeteneklerle değil, verimlilik açısından da önem taşıyor. OpenAI, o4-mini’nin düşük donanım gereksinimleriyle çalıştığını ve buna rağmen beklenenin ötesinde bir performans sunduğunu belirtiyor. Bu da modeli özellikle maliyet hassasiyeti taşıyan kullanıcılar için daha cazip kılıyor. Performans ve maliyet dengesi, yapay zeka kullanımının yaygınlaşmasında kritik bir rol oynuyor.

Her şeye rağmen, görsellerle akıl yürütebilme özelliğinin günlük hayatta nasıl karşılık bulacağı hâlâ test sürecinde. Kullanıcıların modelle etkileşimi arttıkça, bu özelliklerin hangi alanlarda daha fazla işe yarayacağı daha net anlaşılacak. Eğitimden mühendisliğe, görsel analizin kritik rol oynadığı birçok sektör bu gelişmelerden etkilenebilir. Kullanıcı geri bildirimleri, modellerin gelişim yönünü şekillendirecek temel kaynaklardan biri olacak.

Tüm bunların yanında, modellerin entegre araç erişimi sayesinde ChatGPT’nin yetenekleri daha işlevsel hale geliyor. Web üzerinden bilgi aramak, PDF dosyalarını analiz etmek veya doğrudan görsel üretmek artık daha sorunsuz bir biçimde gerçekleşiyor. Kullanıcılar için daha akıcı ve çok yönlü bir deneyim sunulması hedefleniyor. Bu da yapay zekanın yalnızca cevap veren değil, aktif katkı sağlayan bir araca dönüşmesine imkân tanıyor.