DosyaManşetler

DeepSeek: Dünyanın konuştuğu yapay zeka hakkında merak edilen her şey

deepseek

Çin merkezli yapay zeka laboratuvarı DeepSeek, geliştirdiği sohbet uygulamasıyla Apple App Store listelerinin zirvesine çıkarak uluslararası alanda büyük bir ilgi topladı. Şirketin verimli hesaplama teknikleriyle eğitilen yapay zeka modelleri, Wall Street analistleri ve teknoloji uzmanları arasında ABD’nin yapay zeka yarışındaki liderliğini ve yapay zeka çiplerine olan talebin sürdürülebilirliğini sorgulamalarına neden oldu.

DeepSeek ne zaman ve kimin tarafından kuruldu?

DeepSeek, yapay zeka destekli ticaret kararları alan Çinli nicel hedge fonu High-Flyer Capital Management tarafından desteklenmektedir. High-Flyer, 2015 yılında, Zhejiang Üniversitesi’nde öğrenci iken ticarete ilgi duymaya başlayan Liang Wenfeng tarafından kuruldu. 2019’da şirket, yapay zeka algoritmalarının geliştirilmesi ve uygulanmasına odaklanan bir hedge fonu olarak faaliyet göstermeye başladı. 2023’te High-Flyer, finansal işlerinden ayrı olarak yapay zeka araçlarını araştırmaya adanmış bir laboratuvar olan DeepSeek’i kurdu.

Teknik gelişmeler ve modeller

DeepSeek, kendi veri merkezi kümelerini oluşturarak model eğitimine başladı. Ancak, diğer Çinli yapay zeka şirketleri gibi, ABD’nin donanım ihracat yasaklarından etkilendi. Şirket, en son modellerinden birini eğitmek için ABD’li şirketlere sunulan H100 çiplerinin daha az güçlü bir versiyonu olan Nvidia H800 çiplerini kullanmak zorunda kaldı. DeepSeek’in teknik ekibi genç araştırmacılardan oluşuyor ve şirket, Çin’in önde gelen üniversitelerinden doktora düzeyinde yapay zeka araştırmacılarını agresif bir şekilde işe alıyor. Ayrıca, teknolojisinin geniş bir konu yelpazesini daha iyi anlaması için bilgisayar bilimi geçmişi olmayan kişileri de istihdam ediyor.

Kasım 2023’te DeepSeek, ilk model setini — DeepSeek Coder, DeepSeek LLM ve DeepSeek Chat — tanıttı. Ancak, şirketin asıl dikkat çekmesi, bir sonraki nesil DeepSeek-V2 model ailesini piyasaya sürdüğü geçen baharda oldu. DeepSeek-V2, genel amaçlı metin ve görüntü analiz sistemi olarak çeşitli yapay zeka ölçütlerinde iyi performans gösterdi ve o dönemdeki benzer modellere göre daha düşük maliyetle çalıştı. Bu durum, ByteDance ve Alibaba gibi yerel rakiplerini bazı modellerinin kullanım fiyatlarını düşürmeye ve bazılarını tamamen ücretsiz hale getirmeye zorladı.

Aralık 2024’te piyasaya sürülen DeepSeek-V3, şirketin itibarını daha da artırdı. DeepSeek’in iç testlerine göre, DeepSeek V3, Meta’nın Llama ve OpenAI’nin GPT-4o gibi modellerini geride bıraktı. Ayrıca, Ocak ayında piyasaya sürülen DeepSeek’in R1 “akıl yürütme” modeli, OpenAI’nin o1 modeliyle benzer performans sergiliyor. R1, fizik, bilim ve matematik gibi alanlarda daha güvenilir sonuçlar üreten, kendi kendini kontrol eden bir model olarak dikkat çekiyor.

Pazar etkisi ve gelecek perspektifleri

DeepSeek’in ürün ve hizmetlerini piyasa değerinin oldukça altında fiyatlandırması ve bazılarını ücretsiz sunması, iş modeline dair belirsizliklere yol açıyor. Şirket, verimlilikteki atılımlar sayesinde aşırı maliyet rekabetçiliğini sürdürdüğünü belirtiyor. Ancak, bazı uzmanlar şirketin sunduğu rakamları tartışıyor. Her şeye rağmen, geliştiriciler DeepSeek’in modellerine ilgi gösteriyor. Şirketin modelleri açık kaynak olarak kabul edilmese de, ticari kullanım için izin veren esnek lisanslarla sunuluyor. Örneğin, Hugging Face CEO’su Clem Delangue’ye göre, Hugging Face platformundaki geliştiriciler, R1 modelinin 500’den fazla “türev” modelini oluşturdu ve bu modeller toplamda 2,5 milyon indirme sayısına ulaştı.

DeepSeek’in daha büyük ve köklü rakiplerine karşı elde ettiği başarı, yapay zeka alanında “yeni bir dönemin” başlangıcı olarak tanımlanıyor. Şirketin başarısı, Nvidia’nın hisse fiyatının Pazartesi günü %18 düşmesine neden oldu ve OpenAI CEO’su Sam Altman’dan kamuoyuna bir yanıt gelmesine yol açtı. DeepSeek’in geleceği belirsizliğini koruyor. Geliştirilmiş modellerin piyasaya sürülmesi bekleniyor, ancak ABD hükümeti, zararlı yabancı etki olarak algıladığı duruma karşı temkinli yaklaşıyor.