Teknoloji

Microsoft’tan görsellere bakıp içeriklerini söyleyebilen yeni küçük dil modeli

microsoft chatgpt phi-3

Microsoft Phi-3 adını taşıyan küçük dil modelinin görsellere bakıp neler içerdiklerini söyleyebilen yeni versiyonunu duyurdu. Çok modlu bir model olan Phi-3-vision, hem metni hem de görüntüleri okuyabiliyor ve bunu en iyi şekilde mobil cihazlarda kullanabiliyor.

Microsoft, şu anda önizlemede mevcut olan Phi-3-vision’un, grafikler hakkında sorular sormak gibi genel görsel muhakeme görevlerini yapabilen 4.2 milyar parametreli bir model olduğunu (parametreler, bir modelin ne kadar karmaşık olduğunu ve eğitiminin ne kadarını anladığını belirtir) olduğunu söylüyor.

Ancak Phi-3-vision, OpenAI’nin DALL-E’si veya Stability AI’nin Stable Diffusion’ı gibi diğer görüntü odaklı AI modellerinden çok daha küçük. Bu modellerden farklı olarak Phi-3-vision görüntü oluşturmuyor ancak görüntünün içinde ne olduğunu anlayıp kullanıcı için onu analiz edebiliyor.

Yazılım devi, Nisan ayında 3.8 milyar parametreyle en küçük Phi-3 modeli olan Phi-3-mini’nin piyasaya sürülmesiyle Phi-3’ü duyurdu. Phi-3 ailesinin iki üyesi daha bulunuyor: Phi-3-küçük (7 milyar parametre) ve Phi-3-orta (14 milyar parametre).

Yapay zeka modeli geliştiricileri, daha uygun maliyetli ve daha az bilgi işlem yoğunluklu yapay zeka hizmetlerini kullanma talebi arttıkça Phi-3 gibi küçük, hafif yapay zeka modelleri ortaya koyuyor. Küçük modeller, bilgisayar belleğinde çok fazla yer kaplamaya gerek kalmadan telefon ve dizüstü bilgisayar gibi cihazlardaki yapay zeka özelliklerini güçlendirmek için kullanılabilir. Microsoft, Phi-3 ve öncülü Phi-2’ye ek olarak başka küçük modelleri de piyasaya sürdü. Matematik problemi çözme modeli Orca-Math’in, matematik sorularına Google’ın Gemini Pro gibi daha büyük benzerlerinden daha iyi yanıt verdiği bildiriliyor.

Microsoft Phi-3 ailesinin üyelerini Azure’un model kitaplığına ekledi

Phi-3-vision artık önizlemede mevcut. Phi-3 ailesinin diğer üyelerine (Phi-3-mini, Phi-3-small ve Phi-3-medium) artık Azure’un model kitaplığı aracılığıyla ulaşılabiliyor.