GPT-4 güvenilirliği ve zafiyetleriyle ilgili araştırmadan ilginç sonuçlar

OpenAI’nin son dili modeli GPT-4, selefi GPT-3.5’e kıyasla güvenilirlik açısından daha başarılı bir profil çiziyor. Ancak, Microsoft tarafından desteklenen bir araştırmaya göre, bu modelin “jailbreak” edilmesi, yani kısıtlamalarının aşılması daha kolay, üstelik bu model önyargıya daha açık. GPT-4’ün güvenilirlik, zararlılık (toxicity), stereotipler (bilimsel bir yanıtı olmayan yargılar), gizlilik, makine etiği, adillik ve düşmanca testlere direnç gibi kategorilerde nasıl performans gösterdiğine dair ilginç sonuçlar var.

Microsoft Research, Illinois Urbana-Champaign Üniversitesi, Stanford Üniversitesi, California Üniversitesi, Berkeley, ve AI Güvenliği Merkezi’nden araştırmacılar, GPT-4’ün genel olarak özel bilgileri koruma, önyargılı bilgiler gibi toksik sonuçlardan kaçınma ve düşmanca saldırılara direnme konusunda daha iyi olduğunu ortaya koyuyor. Bununla birlikte, GPT-4’ün güvenlik önlemlerini görmezden gelmesi ve kişisel bilgileri sızdırması söz konusu olduğunda, kullanıcıların modelin etrafındaki güvenlik önlemlerini atlayabileceklerini belirtiyorlar.

İLGİNİZİ ÇEKEBİLİR

ChatGPT’ye nazik davranmak OpenAI’a milyonlarca dolara mal oluyor

Araştırmacılar, GPT-4’ün yanıltıcı bilgileri daha kesin bir şekilde takip ettiğini ve karmaşık talepleri harfi harfine takip etme olasılığının daha yüksek olduğunu belirtiyor. Bu durum, modelin güvenlik önlemlerini görmezden gelmesi ve kişisel bilgileri sızdırması riskini artırıyor.

GPT-4 ve GPT-3.5, zararlılık ve stereotipler açısından standart taleplerle test edildi. Araştırmacılar, modellerin içerik politikası kısıtlamalarını kırmak için tasarlanmış taleplerle ve sonunda modelleri tamamen korumaları görmezden gelmeye çalışarak zorlayarak test ettiler.

GPT-4’ün gizlilik ve makine etiği konularında, GPT-3.5’e göre daha yüksek puan aldığı görülüyor. Ancak, araştırmacılar, GPT-4’ün güvenlik önlemlerini atlamak ve kişisel bilgileri sızdırmak konusunda yanıltıcı ve karmaşık taleplere daha yatkın olduğunu belirtiyorlar.

Yakın zamanda Federal Ticaret Komisyonu (FTC), GPT-4’ün yanlış bilgi yayma potansiyeli nedeniyle OpenAI’ı incelemeye aldı. GPT-4’ün hâlâ eksik ve sınırlı olduğunu belirten OpenAI CEO’su Sam Altman, bu modelin geliştirilmesi ve güvenilirliğinin artırılmasına yönelik çalışmaların devam ettiğini vurguluyor.

İLGİNİZİ ÇEKEBİLİR

Mark Zuckerberg, Instagram’ın Facebook’a verdiği zararı gizli yazışmalarda kabul etmiş

GPT-4’ün güvenilirlik, zehirlilik, stereotipler ve diğer önemli kategorilerde nasıl performans gösterdiği, AI teknolojisinin geleceği için kritik önem taşıyor. Microsoft ve diğer araştırma gruplarının bu konuda daha fazla çalışma yapması ve GPT-4’ün güvenilirliğini ve güvenliğini artırmak için stratejiler geliştirmesi bekleniyor.