Bluesky, kullanıcı verilerinin yapay zekâ eğitimi ve kamuya açık arşivleme için nasıl kullanılabileceğine dair yeni bir öneri sundu. Şirket, GitHub üzerinden yayımladığı bu teklifinde, kullanıcıların gönderilerinin ve verilerinin kazınmasına (scraping) izin verip vermeyeceklerini belirleyebilecekleri seçenekler sunmayı planlıyor.
Bluesky CEO’su Jay Graber, bu öneriyi geçtiğimiz hafta başında South by Southwest (SXSW) etkinliğinde sahnede tartıştı. Ancak konu, cuma gecesi Graber’in Bluesky’da bu plan hakkında paylaşım yapmasının ardından yeniden gündeme geldi. Birçok kullanıcı, Bluesky’ın daha önce verdiği, verilerini reklamverenlere satmayacağı ve gönderilerini yapay zekâ eğitiminde kullanmayacağı sözlerine ters düştüğünü düşünerek tepki gösterdi.
Bazı kullanıcılar, Bluesky’ın bu adımını eleştirerek platformun mahremiyet odaklı yaklaşımından uzaklaştığını savundu. Kullanıcı adı “Sketchette” olan bir kişi, “Aman Tanrım, hayır! Bu platformun güzelliği, bilgilerin PAYLAŞILMAMASIYDI. Özellikle de yapay zekâ ile! Şimdi sakın geri adım atmayın,” şeklinde bir yorum yaptı.
Graber ise yapay zekâ şirketlerinin hâlihazırda internet üzerindeki herkese açık verileri kazıdığını, Bluesky’nin de bu süreci daha şeffaf ve kontrollü hâle getirmek istediğini belirtti. Ona göre, Bluesky’nin önerdiği sistem, web sitelerinin arama motorlarıyla iletişim kurmasına yardımcı olan robots.txt dosyasına benzer bir yapı sunarak kullanıcıların tercihlerini belirtmesine olanak tanıyacak.
Yapay zekâ eğitimi ve telif hakkı konularında süregelen tartışmalar, robots.txt dosyasının yasal olarak bağlayıcı olmaması gibi sorunları da gündeme getirdi. Bluesky, sunduğu yeni standardın da benzer bir mekanizmaya sahip olacağını, etik bir çerçeve oluşturacağını ancak yasal bir zorunluluk getirmeyeceğini ifade ediyor.
Bluesky neler öneriyor?
Öneriye göre, Bluesky uygulamasını ya da altyapısını kullanan diğer uygulamaları tercih eden kullanıcılar, ayarlar menüsünden verilerinin dört farklı kategoride nasıl kullanılacağını belirleyebilecek:
- Yapay zekâ eğitimi (Yapay zekâ modellerinin eğitimi için veri sağlama),
- Protokol köprüleme (farklı sosyal medya platformları arasında bağlantı kurma),
- Toplu veri setleri (araştırma veya analiz amaçlı büyük veri kümeleri oluşturma),
- Web arşivleme (örneğin, Wayback Machine gibi arşivleme hizmetleriyle paylaşım).
Bir kullanıcı, yapay zekâ eğitimi için verilerinin kullanılmasını istemediğini belirttiğinde, öneriye göre şirketler ve araştırma ekipleri bu tercihe saygı duymak zorunda olacak. Bu, hem web kazıma (scraping) süreçlerinde hem de protokol aracılığıyla yapılan toplu veri aktarımlarında geçerli olacak.
Teknoloji yazarı Molly White, bu önerinin olumlu bir adım olduğunu ve Bluesky’ın eleştirilmesini şaşırtıcı bulduğunu dile getirdi. Ona göre, bu değişiklik yapay zekânın veri kazımasını teşvik etmekten ziyade, zaten gerçekleşen sürece kullanıcıların rızasını eklemeyi amaçlıyor.
Ancak White, Creative Commons tarafından önerilen benzer “tercih sinyallerinin” etkinliğini sorguluyor. Bu tür sistemlerin, yalnızca veri kazıyıcıların iyi niyetli olması durumunda çalışacağını belirterek, bazı yapay zekâ şirketlerinin robots.txt kurallarını hiçe sayarak içerik kazımaya devam ettiğine dikkat çekti.
Bluesky’nin önerisi henüz kesinleşmiş değil ve tartışmalar sürüyor. Kullanıcıların, platformun şeffaflık ve gizlilik konularında verdiği önceki sözlerle çelişmediğine ikna edilmesi gerekecek gibi görünüyor.