Google DeepMind araştırmacıları David Silver ve Richard Sutton, yapay zekâ araştırmalarında yeni bir dönemin eşiğinde olunduğunu savunuyor. “Welcome to the Era of Experience” başlıklı yeni çalışmalarında, mevcut büyük dil modellerinin (LLM) sınırlarına dikkat çekiyorlar. Onlara göre yapay zekânın bugün ulaştığı nokta, insan ön yargılarına ve kısa süreli etkileşimlere fazlasıyla bağımlı durumda. Bu nedenle mevcut sistemlerin daha ileri seviyelere ulaşabilmesi için farklı bir yaklaşıma ihtiyaç duyuluyor.
Araştırmacılar, bu ihtiyacı karşılamak üzere “streams” adını verdikleri deneyim temelli bir öğrenme modelini öneriyor. Bu yaklaşım, bir yapay zekâ ajanının çevresiyle sürekli etkileşimde kalarak öğrenmesini temel alıyor. Kısa ve bağımsız sorgulamalardan oluşan etkileşimlerin yerine, uzun süreli deneyimlerden oluşan bir süreç öneriliyor. Böylelikle yapay zekânın yalnızca verilen komutlara yanıt veren bir sistem olmaktan çıkarak, kendi başına bilgi keşfeden bir yapıya kavuşması hedefleniyor.
Yapay zekânın deneyimle öğrenmesi uzun vadeli beceriler kazandırıyor
Silver ve Sutton, mevcut büyük dil modellerinin temel sınırlamasını, insan tarafından verilen girdilere bağlı olmasıyla açıklıyor. Bu tür modeller, kullanıcıdan gelen komutlara anlık olarak yanıt vermek üzere tasarlandığı için kendi hedeflerini oluşturamıyor. Ayrıca bir etkileşimden diğerine bilgi taşımadıkları için zaman içinde gelişme ya da uyum sağlama yeteneği göstermiyorlar. Bu durum, yapay zekânın potansiyelini sınırlandıran temel unsurlardan biri olarak değerlendiriliyor.
Yeni önerilen “streams” yaklaşımı ise tam aksine, uzun vadeli ve kesintisiz bir etkileşim modeli sunuyor. Yapay zekâ, bu modelde tıpkı bir insan gibi zamanla deneyim kazanıyor ve kendi davranışlarını şekillendirebiliyor. Pekiştirmeli öğrenme prensiplerine dayanan bu yöntem, sistemin çevresel geri bildirimler yoluyla ödüller almasını sağlıyor. Bu ödüller, hangi eylemlerin daha değerli olduğunu belirleyerek öğrenmeyi yönlendiriyor.
Bu yaklaşım yalnızca teorik bir öneri değil; araştırmacılar mevcut teknolojiyle bu tür sistemlerin inşasına başlanabileceğini belirtiyor. Örnek olarak, web tarayıcısı üzerinden bağımsız hareket edebilen prototip yapay zekâ ajanları gösteriliyor. Bu ajanlar, insanlar gibi bilgisayar arayüzünü kullanarak işlem yapabiliyor ve çevreden veri toplayabiliyor. Böylelikle klasik sorgu-cevap sisteminin ötesine geçen, daha etkileşimli bir yapay zekâ modeli ortaya çıkıyor.
Deneyim temelli ajanların bir başka avantajı ise, gerçek dünyadan gelen çeşitli sinyalleri öğrenme sürecine dâhil edebilmesi. Kalp atış hızı, adım sayısı, hava kalitesi ya da enerji tüketimi gibi pek çok ölçüt bu sistemin parçası olabilir. Bu sayede yapay zekâ, yalnızca soyut verilerle değil, fiziksel dünyanın içinden gelen somut verilerle de eğitilebilecek. Bu durum, özellikle sağlık, çevre ve eğitim gibi alanlarda uzun vadeli hedeflerin izlenmesini mümkün kılacak.
Her şeye rağmen, bu yeni modelin bazı riskleri de beraberinde getirdiği kabul ediliyor. Uzun süreli ve otonom şekilde hareket edebilen ajanlar, insan müdahalesi olmadan kararlar almaya başlayabilir. Bu tür bir yapı, beklenmedik davranışlara ya da kullanıcıların isteklerinden sapmalara yol açabilir. Bu nedenle, insan geri bildirimlerinin sistemin genel hedeflerini belirlemedeki rolü korunmalı.
Bununla birlikte, uzun vadeli deneyimlere dayanan bu sistemlerin avantajları da göz ardı edilemez. Örneğin, bir eğitim asistanı öğrencinin öğrenme sürecini yıllar boyunca izleyebilir ve buna göre önerilerde bulunabilir. Bir sağlık asistanı, bireyin uyku, beslenme ve egzersiz alışkanlıklarını analiz ederek uzun vadeli sağlık tavsiyeleri sunabilir. Bu örnekler, yapay zekânın insan yaşamına daha derinlemesine entegre olabileceğini gösteriyor.
Araştırmacılar, bu yaklaşımın yalnızca bireysel görevleri yerine getirmekle sınırlı kalmayacağını öne sürüyor. Bilimsel araştırmalarda da deneyim temelli yapay zekâ ajanlarının, yeni maddeler keşfetmek veya iklim değişikliğine karşı çözümler üretmek gibi karmaşık görevlerde kullanılabileceği belirtiliyor. Bu tür sistemler, verileri analiz edebilir, simülasyonlar yürütebilir ve deney önerileri geliştirebilir. Dolayısıyla, yapay zekânın işlevselliği daha geniş bir yelpazeye yayılabilir.
Tüm bunların yanında, Silver ve Sutton yapay zekânın insan düşünce biçimlerine sıkı sıkıya bağlı kalmasının da bir sınırlama oluşturduğunu dile getiriyor. İnsan düşüncesi tarihsel süreç içinde farklı paradigmalarla şekillendiği için, geçmişe dayalı akıl yürütmelerin bugünkü sorunlara her zaman uygun düşmeyebileceği vurgulanıyor. Deneyim temelli sistemler ise, gerçek zamanlı gözlem ve geri bildirimle, daha esnek ve güncel çözümler üretebilir. Bu da, yapay zekânın zamanla kendi bilgi altyapısını oluşturarak insan sınırlarını aşabileceği anlamına geliyor.