Teknoloji

Anthropic’in Claude 3.5 Sonnet AI modeli bilgisayarı kendi başına kullanabiliyor

claude 3.5 sonnet anthropic

Anthropic, yapay zeka alanında önemli bir adım atarak Claude 3.5 Sonnet modeline yeni bir yetenek ekledi. Bu model, “bilgisayar kullanımı” olarak adlandırılan bir özellikle donatıldı ve şu anda halka açık beta sürümüyle kullanıma sunuldu. Bu özellik sayesinde Claude, bir insan gibi bilgisayar ekranına bakarak fare imlecini hareket ettirebiliyor, butonlara tıklayabiliyor ve metin yazabiliyor. API aracılığıyla geliştiriciler, Claude’un bir bilgisayarda insan gibi çalışmasını sağlayabiliyor. Bu işlevsellik, ilk kez bir Mac bilgisayar üzerinde sergilendi.

Microsoft’un Copilot Vision ve OpenAI’nin ChatGPT masaüstü uygulaması, kullanıcıların ekranlarını görebilen yapay zeka araçlarının yeteneklerini gözler önüne sermişti. Google da benzer işlevlere sahip Gemini uygulamasını Android cihazlar için geliştirmişti. Ancak, bu çözümler henüz yaygın olarak kullanılabilir bir biçimde bilgisayar üzerinde işlem yapma ve görevleri tamamlama aşamasına gelmedi. Benzer bir vaatle yola çıkan Rabbit, R1 modelinde bu özellikleri sunmayı hedeflemiş olsa da, henüz bu özelliği piyasaya sürebilmiş değil.

Anthropic, bu yeni özelliğin henüz deneysel olduğunu ve bazı eksiklikler içerdiğini belirtiyor. Şirketin açıklamasına göre, bu işlev “karmaşık ve hata yapmaya eğilimli” olabilir. Şirket, geliştiricilerden geri bildirim toplamak amacıyla bu özelliği erken aşamada kullanıma sunduğunu ve zaman içinde önemli iyileştirmeler yapılacağını öngörüyor.

Geliştiricilere göre Claude’un şu anda bilgisayarda yapabildiği işlemler sınırlı. Örneğin, sürükleme, yakınlaştırma gibi rutin işlemler Claude tarafından henüz gerçekleştirilemiyor. Claude’un ekranı izleme yöntemi, bir video akışı yerine ekran görüntülerini bir araya getiren bir “flipbook” yapısına dayanıyor. Bu nedenle kısa süreli bildirimler ya da hızlı gerçekleşen eylemler Claude’un dikkatinden kaçabiliyor.

Buna ek olarak, Claude’a sosyal medya ile etkileşime girmemesi gerektiği talimatı verilmiş durumda. Ayrıca, seçimle ilgili faaliyetlerde yer almaması ve sosyal medyada içerik oluşturma, web alanı kaydetme ya da devlet siteleriyle etkileşimde bulunma gibi görevlerden uzak durması için çeşitli sistemler geliştirilmiş. Bu önlemlerle Claude’un güvenli ve etik sınırlar içinde çalışması hedefleniyor.

Anthropic’in Claude 3.5 Sonnet modeli, yalnızca bilgisayar kullanımı işlevselliğiyle değil, aynı zamanda birçok alanda gösterdiği performans iyileştirmeleriyle de dikkat çekiyor. Şirket, bu yeni sürümün birçok endüstri standardı kıyaslamasında ciddi iyileştirmeler kaydettiğini belirtiyor. Özellikle yazılım kodlama ve araç kullanımı görevlerinde Claude’un performansı kayda değer ölçüde artmış durumda. Claude, SWE-bench Verified testinde yüzde 33,4’ten yüzde 49’a yükselerek, OpenAI gibi rakiplerinin önüne geçti.

Araç kullanım görevlerinde ise Claude, perakende sektöründe TAU-bench testinde yüzde 62,6’dan yüzde 69,2’ye, daha zorlu bir alan olan havacılık sektöründe ise yüzde 36’dan yüzde 46’ya kadar performans artışı sağladı. Bu gelişmeler, Claude’un çok daha etkin bir yapay zeka aracı haline geldiğini gösteriyor ve kullanıcılar için daha işlevsel bir deneyim sunmayı amaçlıyor.

Anthropic yeni modelini aynı fiyat ve hızla sunuyor

Anthropic’in yeni Claude 3.5 Sonnet modeli, önceki sürümle aynı fiyat ve hızda sunuluyor ve bu da müşterilere daha gelişmiş yetenekleri ek bir maliyet olmadan deneyimleme fırsatı veriyor.