Mart ayındaki bir Reuters raporunda DeepSeek’in bu ay içinde R2’yi piyasaya sürmeye hazırlandığı belirtiliyordu. Ancak şirket henüz tarihi doğrulamadı.
Sızdırılan bilgilere göre DeepSeek R2 önceki nesli ikiye katlıyor ve saniyede 1.2 trilyon işleme çıkıyor.
GPT-4 Turbo ve Google Gemini 2.0 Pro ile doğrudan rekabet edecek güce sahip olan DeepSeek R2
%97 civarında daha düşük maliyetler sunacak.
DeepSeek R2 versiyonunun girdi başına milyon token maliyeti 0.07$ iken üretim başına milyon token maliyeti ise 0.27$ olarak belirlenmiş. Böylece piyasadaki en düşük maliyetli yapay zekâ modeli haline geliyor.
yeni gelişmiş model R2’nin, OpenAI’nin GPT-40 modelinden %97,3 daha ucuz hale getiren, hibrit uzmanlar karışımı (MoE) mimarisiyle geliştirildiği söyleniyor. MoE, bir görevi birlikte gerçekleştirmek için bir AI modelini ayrı alt ağlara bölen bir makine öğrenme yaklaşımıdır. Bu, ön eğitim sırasında hesaplama maliyetlerini büyük ölçüde azaltacak ve çıkarım süresi boyunca daha hızlı performans elde edecektir, diye bildirdi yayın kuruluşu.
Uzmanlar, R2’nin, vizyon işlevi olmayan R1’den “daha iyi bir vizyon” olduğunu iddia ettiler. Ayrıca, 1,2 trilyon parametreye sahip olması ve 5,2 petabayt veri üzerinde eğitilmesi bekleniyor.
Uzmanlar, DeepSeek’in bu yeni modelle Huawei’yi NVIDIA’ya ilk büyük rakip olarak konumlandırabileceğini söyledi. Yapay zeka girişiminin ayrıca kendi modellerini ücretsiz kullanıma sunarak açık kaynaklı yapay zeka kategorisinde Meta’yı ele geçirmeyi planladığını da eklediler.
Özellikle DeepSeek, son aylarda Batılı rakipleriyle rekabet eden ve daha düşük operasyonel maliyetler sunan bir dizi model piyasaya sürerek küresel yapay zeka alanında hızla önemli bir oyuncu olarak ortaya çıktı.
Yeni versiyon artık Nvidia hızlandırıcılarına da bağımlı değil. Yüzde 82 oranında Huawei Ascend 910B hızlandırıcısı kullanıyor. Böylece yeni ABD ambargoları performans tarafında etkili olamayacak.
Ayrıca dikey entegrasyon da sağlanmış olacak.
Mart ayında şirket, V3 büyük dil modelinde büyük bir yükseltme yayınlayarak OpenAI ve Anthropic gibi ABD teknoloji liderleriyle rekabeti yoğunlaştırdı. Reuters’a göre yeni model, AI geliştirme platformu Hugging Face aracılığıyla kullanıma sunuldu ve şirketin hızla gelişen AI pazarında kendini kanıtlamak için attığı son adım oldu.
O dönemde uzmanlar, DeepSeek-V3-0324’ün, Hugging Face’te yayınlanan çok sayıda teknik ölçümde gelişmiş performans gösteren kıyaslama testleriyle birlikte, öncülüne kıyasla muhakeme ve kodlama yetenekleri gibi alanlarda önemli gelişmeler gösterdiğini belirtmişlerdi.
ABD’nin ambargolarla engellemek istediği Çinli yapay zekâ projeleri adeta kâbus gibi geri dönüyor.
AMD ve Batı borsalarına trilyonlarca dolar kaybettiren DeepSeek yeni versiyonuyla yine fırtına estirecek gibi.