Google, Gizmodo’nun pazartesi günü haberleştirdiği şekilde, internetten topladığı kamuya açık veriler üzerinde eğitilebilecek olan çeşitli yapay zeka (AI) hizmetlerini açıklamak için gizlilik politikasını güncelledi. Bard ve Bulut AI hizmetleri, bu gizlilik politikası değişikliği ile Google Translate ile birlikte veri toplama ve kullanma uygulamalarının bir parçası haline geldi.
Google sözcüsü Christa Muldoon, “Gizlilik politikamız, Google’ın Google Translate gibi hizmetler için dil modellerini eğitmek amacıyla açık web’den kamuya açık bilgileri kullandığını uzun süredir açıklamaktadır.” dedi. Muldoon, “Bu son güncelleme, Bard gibi daha yeni hizmetlerin de dahil olduğunu açıklığa kavuşturuyor. AI teknolojilerimizin geliştirilmesine gizlilik ilkelerini ve güvencelerini entegre ediyoruz, bu da AI İlkelerimizle uyumlu.” ifadelerini kullandı.
1 Temmuz 2023 tarihli güncelleme sonrasında, Google’ın gizlilik politikası, şirketin “kullanıcıları ve kamu yararına yeni ürünler, özellikler ve teknolojiler geliştirmek ve hizmetlerini iyileştirmek için bilgi kullanıyor” olduğunu belirtiyor. Ayrıca gizlilik politikası, şirketin, “Google Translate, Bard ve Bulut AI yetenekleri gibi ürünler ve özellikler oluşturmak için Google’ın AI modellerini eğitmeye yardımcı olmak üzere kamuya açık bilgileri kullanabileceğini” dile getiriyor.
Politikanın revizyon tarihçesi, toplanan verileri kullanarak eğitilecek hizmetlere ek netlik sağladığı görülebilir. Örneğin, belge artık bilgilerin “AI Modelleri” için kullanılabileceğini belirtiyor, bu da Google’a kamuya açık verilerinize dayalı olarak LLM’lerin yanında sistemler eğitmekte ve inşa etmekte daha fazla özgürlük sağlıyor. Ancak bu bile politikanın “Yerel Bilgileriniz” sekmesi altında “kamuya açık kaynaklar” için gömülü bir bağlantı altında gömülü olan bir not.
İlginizi çekebilir
Ayrıca, “kamuya açık bilgilerin” Google’ın AI ürünlerini eğitmek için kullanıldığını belirtiyor, ancak şirketin bu veri havuzuna telif hakkı ile korunan materyallerin dahil edilip edilmediğini (veya nasıl) önleyeceği belirtilmiyor. Birçok kamuya açık web sitesi, büyük dil modelleri ve diğer AI setlerini eğitmek amacıyla veri toplama veya web’den veri almayı yasaklayan politikalara sahip. Google’ın bu yaklaşımının, kişilerin verilerinin açık izinleri olmadan kötüye kullanılmasına karşı koruma sağlayan GDPR gibi çeşitli global düzenlemelerle nasıl sonuçlanacağı ilginç olacak.
Google Bard ve diğer yapay zekâ motorları ile ilgili tartışmalar artacak
Bu yasalar ve artan piyasa rekabeti, OpenAI’ın GPT-4 gibi, popüler oluşturucu AI sistemlerin yapımcılarının, onları eğitmek için kullanılan verilerin nereden geldiği ve sosyal medya gönderilerini veya insan sanatçıları ve yazarları tarafından telif hakkıyla korunan eserleri içerip içermediği konusunda son derece temkinli olmalarına neden oldu.
Adil kullanım doktrininin bu tür bir uygulamayı kapsayıp kapsamadığı meselesi şu anda hukuki bir gri alanda bulunuyor. Belirsizlik, çeşitli dava başlatmaları ve bazı ülkelerdeki yasama organlarının, AI şirketlerinin eğitim verilerini nasıl toplayıp kullandıklarını düzenlemek için daha iyi donanımlı daha sıkı yasaları tanıtmalarını zorladı. Ayrıca, bu verinin AI sistemlerinde tehlikeli başarısızlıklara katkıda bulunmamasını sağlamak için nasıl işlendiği konusunda soruları da gündeme getiriyor, bu büyük eğitim veri havuzlarından geçmekle görevlendirilen kişiler genellikle uzun saatler ve aşırı çalışma koşullarına tabi tutuluyor.
ABD’nin en büyük gazete yayıncısı olan Gannett, Google’ı ve ana şirketi Alphabet’i, AI teknolojilerindeki ilerlemelerin arama devine dijital reklam pazarında bir tekel sağladığı iddiasıyla dava ediyor. Google’ın AI arama beta gibi ürünleri ayrıca “intihal motorları” olarak anıldı ve web sitelerini trafikten mahrum bıraktıkları gerekçesiyle eleştirildi.
Öte yandan, büyük miktarda kamusal bilgi içeren iki sosyal platform olan Twitter ve Reddit, diğer şirketlerin verilerini serbestçe toplamasını önlemek için son zamanlarda radikal önlemler aldı. Platformlara konulan API değişiklikleri ve sınırlamalar, çekirdek Twitter ve Reddit kullanıcı deneyimlerini olumsuz etkileyen anti-scraping değişikliklerle toplulukları tarafından tepki gördü.