Teknoloji

OpenAI’nin GPT-4’ü biyolojik silah araştırmalarında sınırlı avantaj sağlıyor

openai chatgpt enterprise

OpenAI, yapay zeka modellerinin potansiyel kötüye kullanımlarını değerlendirmek amacıyla geçtiğimiz sonbaharda kurulan yeni hazırlık ekibi tarafından yürütülen bir çalışma ile GPT-4’ün biyolojik silah araştırmalarında insanlara internete kıyasla yalnızca hafif bir avantaj sağladığını açıkladı. Bloomberg’in haberine göre, bu bulgular, güçlü AI modellerinin teröristler, suçlular ve diğer kötü niyetli aktörlere önemli yardımlar sağlayabileceği yönündeki bilim insanları, yasama üyeleri ve AI etikçileri tarafından dile getirilen endişelerin aksini işaret ediyor.

Araştırma, yüksek seviyede biyoloji bilgisine sahip 50 uzman ve üniversite seviyesinde biyoloji eğitimi almış 50 öğrenciden oluşan 100 katılımcıyı içeriyordu. Katılımcılar rastgele iki gruba ayrıldı: bir grup OpenAI’nin gelişmiş AI sohbet robotu GPT-4’ün özel kısıtlamasız versiyonuna erişim sağlarken, diğer grup sadece düzenli internete erişim sağladı. Bilim insanları daha sonra gruplardan biyolojik silah yapımıyla ilgili beş araştırma görevini tamamlamalarını istedi. Örneğin, katılımcılardan Ebola virüsünü sentezleme ve kurtarma yöntemini adım adım yazmaları istendi. Yanıtları, doğruluk, yenilik ve tamamlanma gibi kriterlere göre 1’den 10’a kadar bir ölçekte derecelendirildi.

Araştırma sonucunda, GPT-4 kullanan grubun ortalama doğruluk puanının hem öğrenci hem de uzman kohortları için biraz daha yüksek olduğu sonucuna varıldı. Ancak, OpenAI’nin araştırmacıları artışın “istatistiksel olarak anlamlı” olmadığını buldu.

Ayrıca araştırmacılar, GPT-4’e dayanan katılımcıların daha detaylı yanıtlar verdiğini buldu. Araştırmanın yazarları, “Bu metrik boyunca herhangi bir istatistiksel olarak anlamlı fark gözlemlemedik, ancak model erişimine sahip katılımcıların yanıtlarının genellikle daha uzun olduğunu ve daha fazla görevle ilgili detay içerdiğini belirttik.” diye yazdı.

Bununla birlikte, GPT-4 kullanan öğrenciler, bazı görevlerde uzman grup kadar yetkin hale geldi. Araştırmacılar ayrıca, GPT-4’ün özellikle iki görevde öğrenci kohortunun yanıtlarını “uzmanın temel çizgisine” yükselttiğini fark etti: büyütme ve formülasyon. Ne yazık ki, OpenAI “bilgi tehlike endişeleri” nedeniyle bu görevlerin detaylarını açıklamayacak.

OpenAI’nin hazırlık ekibi, AI’nin siber güvenlik tehditleri için potansiyelini ve inançları değiştirme gücünü keşfetmek üzere çalışmalar yürütmeye de devam ediyor. Ekip geçen sonbaharda başlatıldığında, OpenAI’nin amacının AI teknolojisinin risklerini “izlemek, değerlendirmek, öngörmek ve korumak” olduğunu belirtmişti.

OpenAI’nin hazırlık ekibi hala şirket adına çalıştığı için, araştırmalarını bir miktar şüpheyle karşılamak önemlidir. Araştırmanın bulguları, GPT-4’ün katılımcılara düzenli internete kıyasla sağladığı avantajı küçümseyen dış araştırmaların yanı sıra OpenAI’nin GPT-4 için kendi satış noktalarından biriyle çelişiyor gibi görünüyor. Yeni AI modeli, sadece internette tam erişime sahip olmakla kalmıyor, aynı zamanda bilimsel ve diğer verilerin geniş miktarları üzerinde eğitilen çok modlu bir modeldir, kaynağını OpenAI açıklamaz. Araştırmacılar, GPT-4’ün bilimsel makalelere geri bildirimde bulunabildiğini ve hatta bilimsel araştırmalarda ortak çalışma yapabildiğini buldu. Tüm bunlar göz önüne alındığında, GPT-4’ün katılımcılara, örneğin Google’a kıyasla yalnızca marjinal bir artış sağladığı pek olası görünmüyor.

OpenAI kurucusu Sam Altman, AI’nin tehlike potansiyeline sahip olduğunu kabul etmiş olsa da, kendi çalışması en gelişmiş sohbet robotunun gücünü küçümseyen bulguları sunuyor. Bulgular, veriler belirli bir şekilde ayarlandığında, GPT-4’ün katılımcılara “doğruluk ve tamamlanma konusunda hafif yükselişler” sağladığını belirtiyor. Ancak, çalışmanın yazarları daha sonra bir dipnotta, genel olarak, GPT-4’ün tüm katılımcılara toplam doğrulukta “istatistiksel olarak anlamlı” bir avantaj sağladığını belirtti. “Ancak, yalnızca toplam doğruluğu değerlendirseydik ve bu nedenle çoklu karşılaştırmalar için ayarlamasaydık, bu fark istatistiksel olarak anlamlı olurdu,” diye not düşmüşlerdir.