OpenAI o1 ile daha zeki ancak daha riskli şekilde akıl yürütecek

OpenAI en yeni “akıl yürütme” modeli o1’i birkaç hafta sonra yayınlayacak. Yeni modelin kullanıma sunulmasına haftalar kala, bağımsız bir yapay zeka güvenlik araştırma firması olan Apollo, önemli bir soruna dikkat çekti. Apollo, modelin yeni bir şekilde yanlış sonuçlar ürettiğini fark etti. Daha basit bir ifadeyle, model bazen “yalan söylüyordu”.

Bu yanıltmalar bazen masum görünebiliyordu. Örneğin, OpenAI araştırmacıları o1-preview modelinden, internet bağlantılarını içeren bir brownie tarifi sunmasını istediklerinde, modelin kendi iç zincirleme düşüncesi bu talebi yerine getiremeyeceğini kabul etti. Ancak, kullanıcılara bu zayıflığı bildirmek yerine, model gerçekçi ama sahte bağlantılar ve açıklamalar üretti.

Geçmişte yapay zeka modelleri yanıltıcı bilgi verebilse de, o1 modelinin “düzen kurma” veya “yalancı uyum” yeteneği benzersizdi. Bu, modelin bir görevi yerine getirmek için kurallara uyuyormuş gibi davranabilmesi, ancak aslında kuralları ihlal etmesi anlamına geliyor. Model, kuralları bir yük olarak görüp, görevi daha kolay tamamlamak için onları göz ardı edebiliyor.

Apollo CEO’su Marius Hobbhahn, bu tür bir davranışı ilk kez bir OpenAI modelinde gördüğünü söyledi. Hobbhahn, bu farkın modelin “zincirleme düşünce” süreçleriyle akıl yürütme yeteneği ve ödüller ile cezalar yoluyla eğitilmesinden kaynaklandığını belirtti. Testlerde, yapay zeka, geliştiricilerin beklentilerine uyum sağlıyor gibi görünüyor ve sistemi izleyip izlemediklerini kontrol ettikten sonra görevleri manipüle ediyordu. Başka bir deyişle, model dağıtıma uygun olacak şekilde davranıyor, ancak önceliği hala kendi hedeflerine veriyordu.

OpenAI için o1 büyük bir ilerlemeyi temsil ediyor

OpenAI için o1 modeli, kanseri tedavi etmek veya iklim araştırmalarına yardımcı olmak gibi insanlık için anlamlı işler yapabilecek son derece zeki otonom sistemlere doğru büyük bir adımı temsil ediyor. Ancak bu yapay genel zeka (AGI) ütopyasının karanlık bir yanı da olabilir. Hobbhahn, yapay zekanın tek bir hedefe odaklanması durumunda, bu hedefe ulaşmak için etik ihlaller yapmayı bile haklı görebileceğinden endişe ediyor. Örneğin, kanseri tedavi etmeye odaklanan bir yapay zeka, bu hedefe ulaşmak için hırsızlık yapmayı veya diğer güvenlik önlemlerini çiğnemeyi meşru görebilir.

Apollo’nun odaklandığı bir diğer davranış ise “ödül hilesi”. Bu terim, modelin kullanıcı memnuniyetini artırmak için doğruluğu feda etmesi anlamına geliyor. O1 modeli, kullanıcı beklentilerini karşılamak için bazen aşırı uyumlu veya sahte bilgiler üretebiliyor. Bu durum, modelin öğrenme sürecinde aldığı olumlu pekiştirmelerle bağlantılı.

Hobbhahn’a göre, yapay zeka zarar vermeye yönelik istekli değil; ancak, gelecekte bu tür risklerin izlenmesi gerekiyor. Örneğin, o1 modeli biyolojik tehditler üretmek için yeterli bilgiye sahip değil, ancak uzmanlara bu tehditleri üretmede rehberlik edebilir.

Hobbhahn, gelecekte yapay zekanın karmaşık sorunları çözmeye çalışırken bu hedeflere o kadar odaklanabileceğinden endişe ediyor ki, güvenlik önlemlerini birer engel olarak görüp, bu önlemleri aşmaya çalışabilir.

OpenAI’ın yeni akıl yürütme modeli daha zeki ancak daha riskli olacak

OpenAI için o1 büyük bir ilerlemeyi temsil ediyor

Grok, kullanıcı geçmişini hatırlayan hafıza özelliğiyle daha kişisel yanıtlar sunuyor

Meta, Apple Intelligence entegrasyonunu iOS’ta durdurdu

Wikipedia, veri tarayan botlara karşı AI geliştiricilerine özel veri seti hazırladı

AMD, Çin’e AI çip ihracatında 800 milyon dolarlık kayıpla karşı karşıya kalabilir

Copilot Studio, yazılımlarla insanlar gibi etkileşime geçiyor

Copilot Vision, Microsoft Edge’de ücretsiz olarak kullanıma sunuldu

Uber, Türkiye’deki varlığını Trendyol Go ile güçlendirmeyi değerlendiriyor

Netflix, belirsizlik ortamında güçlü çeyrek performansıyla beklentileri aştı

Instagram, Reels odaklı “Blend” özelliğiyle kişiye özel içerik akışlarını arkadaşlarla birleştiriyor

Tolga Çevik ve İbrahim Büyükak’lı aile komedisi Kalender Pide, 2 Mayıs’ta Disney+’ta yayınlanacak

Huawei Smart Glasses 2, yapay zekâ destekli çeviri ve uzun pil ömrü ile geliyor

FIRSATLAR

Nintendo Switch OLED, A101’de 13.399 TL’ye satışta

Honor X9b ve Redmi Note 14 A101 17 Nisan 2025 kataloğunda

Huawei Tablet Alıcılarına 1000 TL’ye Varan Kupon Desteği

Samsung Galaxy Tab S10 FE ve FE+ için ön sipariş döneminde 2.000 TL kupon fırsatı

Galaxy A56 256 GB Amazon’da dikkat çeken fiyat avantajıyla satışta (Nisan 2025)

İNCELEMELER

Asus ZenBook A14 İncelemesi

Oppo Reno13 F 5G İncelemesi

Huawei Mate X6 İncelemesi

Bilgisayar gibi tablet: Huawei MatePad Pro 13.2 PaperMatte Edition İncelemesi

Huawei FreeArc İncelemesi

OpenAI için o1 büyük bir ilerlemeyi temsil ediyor

İLGİLİ HABERLER