Teknoloji

Apple’dan resimleri yazılı komutlarla düzenleyebilen yapay zekâ modeli

apple ios 18

Apple hâlihazırda yapay zekâ pazarının en iyi oyuncularından biri değil. Ancak şirketin görüntü düzenlemeye yönelik yeni açık kaynaklı yapay zekâ modeli, teknoloji devinin bu alanda ne kadar katkı sağlayabileceğini gösteriyor.

Söz konusu model, MLLM Kılavuzlu Görüntü Düzenleme (MGIE) adını taşıyor. Burada görüntüler, çok modlu büyük dil modelleri aracılığıyla metin tabanlı komutların işlenmesiyle yorumlanıyor. Başka bir deyişle, Apple’ın aracı kullanıcıların yazdığı metne göre fotoğrafları düzenleyebiliyor.

Şirket, MGIE’yi Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılarla geliştirdi. MLLM’ler, basit veya belirsiz metin istemlerini, fotoğraf düzenleyicinin izleyebileceği daha ayrıntılı ve net talimatlara dönüştürme gücüne sahiptir. Örneğin, bir kullanıcı biberli pizzanın fotoğrafını “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM’ler bunu “sebze malzemeleri ekleyin” olarak yorumlayabilir ve fotoğrafı bu şekilde düzenleyebilir.

apple

MGIE, görüntülerde büyük değişiklikler yapmanın yanı sıra, metin istemleri yoluyla fotoğrafları kırpabilir, yeniden boyutlandırabilir ve döndürebilir, ayrıca parlaklığını, kontrastını ve renk dengesini iyileştirebilir. Ayrıca bir fotoğrafın belirli alanlarını düzenleyebilir ve örneğin fotoğraftaki bir kişinin saçını, gözlerini ve kıyafetlerini değiştirebilir veya arka plandaki öğeleri kaldırabilir.

Apple yeni aracını GitHub aracılığıya yayınladı

Apple, modeli GitHub aracılığıyla yayınladı ancak ilgilenenler şu anda Hugging Face Spaces üzerinden de demoya erişebiliyor. Şirket, bu projeden öğrendiklerinden nasıl yararlanmayı planladığı konusunda bilgi vermedi.