Meta LLaMA adlı yeni yapay zekâ tabanlı dil modelinin duyurusunu gerçekleştirdi. Son birkaç haftadır teknoloji dünyasındaki en popüler konulardan bir tanesi yapay zekâ (AI) tabanlı dil modelleri. Microsoft, Google ve OpenAI gibi şirketlerin ürünlerini son zamanlarda sıklıkla konuşuyor ve haberleştiriyoruz. Şimdi bu şirketlerin arasına Facebook’un ana şirketi Meta da katılıyor. Meta da bir süredir bu alanda önemli çalışmalar yapıyor ve cuma günü LLaMA adlı yeni bir AI dil oluşturucuyu kullanıma sundu.
LLaMA, ChatGPT veya Bing gibi değil, çünkü kimsenin sohbet edeceği bir arayüz sunmuyor. Bunun aksine, Meta’nın “bu önemli, hızla değişen alanda erişimi demokratikleştirme” umuduyla paylaştığını söylediği bir araştırma aracı niteliğini taşıyor. Başka bir deyişle; uzmanların, önyargı ve hakaretten basitçe bilgi uydurma eğilimlerine kadar yapay zekâ dil modellerinin sorunlarını çözmelerine yardımcı olmak.
Aslında LLaMA tek bir sistem değil, farklı boyutlardaki dörtlü modellerden oluşan bir yapı. Meta; üniversiteler, sivil toplum kuruluşları ve endüstri laboratuvarları gibi gruplara erişim izni veriyor. Böylelikle dil modelini araştırma odaklı kullanım durumlarına hitap eden ve ticari olmayan bir lisans altında kullanıma sunmuş oluyor.
Şirket, konuyla ilgili yazısında, “Tüm AI topluluğunun; akademik araştırmacıların, sivil toplumun, politika yapıcıların ve endüstrinin, genel olarak sorumlu AI ve özel olarak sorumlu büyük dil modelleri etrafında net yönergeler geliştirmek için birlikte çalışması gerektiğine inanıyoruz.” dedi. “Topluluğun LLaMA kullanarak neler öğrenebileceğini ve nihayetinde inşa edebileceğini görmek için sabırsızlanıyoruz.”
Meta LLaMA’nın karşılaştırma testlerindeki iddiasını ortaya koyuyor
Konuyla ilgili bir araştırma makalesinde Meta, LLaMA modelinin en küçük ikinci versiyonu olan LLaMA-13B’nin çoğu karşılaştırma testinde, OpenAI’nin popüler GPT-3 modelinden daha iyi performans gösterdiğini belirtiyor. En büyük model olan LLaMA-65B’nin ise, DeepMind’den Chinchilla70B ve Google’dan PaLM 540B gibi en iyi modellerle rekabet edebilir sonuçlar elde ettiğini olduğunu iddia ediyor. Söz konusu modellerin adlarındaki sayılar, her modeldeki milyarlarca parametreyi ifade ediyor. Sistemin boyutunun bir ölçüsü ve karmaşıklığının kabaca bir tahminidir.
LLaMA-13B, bir kez eğitildikten sonra, tek bir veri merkezi sınıfı Nvidia Tesla V100 GPU üzerinde de çalışabilir. Bu durum, söz konusu sistemler üzerinde test yapmak isteyen küçük boyutlu işletmeler ve kuruluşlar için memnun edici bir gelişme olacaktır.
Meta’nın kendi yapay zekâ dil modelini kullanıma sunması, yapay zekâ tabanlı sohbet robotlarıyla ilgili haberlerin kısmen sönmeye başladığı bir zamanda geldiği için ilginç görünüyor. Yine de, Microsoft’un Bing’in lansmanını aceleye getirdiği için aldığı eleştiri ve kendi sohbet robotunun bir sunumda yaptığı hatadan sonra Google’ın hisse senedi fiyatının düşüşe geçmesi göz önüne alındığında, Meta’nın geç kalması kötü bir şey olmayabilir.
İlginizi çekebilir
Aslında Meta, geçmişte kendi erişilebilir yapay zekâ tabanlı sohbet robotlarını piyasaya sürmüştü, ancak bunlar çok fazla ses getirmedi. Örneğin BlenderBot gibi basit bir robot, çok iyi olmadığı için eleştirildi. Bilimsel makaleler yazmak için tasarlanan Galactica adlı bir diğeri ise bilimsel saçmalıklar üretttiği için yalnızca üç gün sonra kapatıldı.
CEO Mark Zuckerberg, konuyla ilgili bir Facebook gönderisinde, “Bugün, araştırmacıların çalışmalarını ilerletmelerine yardımcı olmak için tasarlanmış, LLaMA adlı yeni, son teknoloji bir yapay zeka büyük dil modelini kullanıma sunuyoruz.” dedi. “LLM’ler metin oluşturma, konuşma yapma, yazılı materyali özetleme ve matematik teoremlerini çözme veya protein yapılarını tahmin etme gibi daha karmaşık görevlerde çok fazla umut vaat etti. Meta, bu açık araştırma modeline kendini adamıştır ve yeni modelimizi yapay zekâ araştırma topluluğunun kullanımına sunacağız.”