ChatGPT’den %97 Daha Ucuz Olacak Deepseek R2 Hakkında İlk Bilgiler Sızdırıldı: En GeliÅŸmiÅŸ Yapay Zeka mı?
Çinli yapay zekâ şirketi DeepSeek, geliştirdiği modellerle tüm dünyada gündem olmayı başarmıştı. Şirket, OpenAI’ın ChatGPT’si üzere rakiplerine kıyasla gelişmiş özellikleri uygun maliyetlerle sunabilmesiyle dikkatleri toplamıştı. Artık ise yeni modelini çıkarmaya hazırlanıyordu.
Biz de DeepSeek R2 hakkında ortaya çıkan bilgilere bakıyoruz. Bu bilgiler yanlışsız çıkarsa ChatGPT yeniden çok büyük bir rakiple karşı karşıya kalacak diyebilirizi.
HUAWEI’nin GPU’larında eğitilen yeni R2, GPT-4’ten %97 daha ucuz olacak
İddialara nazaran yeni kuşak DeepSeek R2 modeli; evvelki modeli katlayarak 1,2 milyon parametreli bir model olarak karşımıza çıkacak. Modelin, yapay zekâ iş yükleri için optimize edilmiş MoE isimli hibrit mimari üzerinde inşa edildiği de söyleniyor. Yeni R2, Huawei’nin Ascend 910B yapay zekâ GPU’ları üzerinde eğitilmiş.
Böylece OpenAI’ın ChatGPT’de kullandığı GPT-4 modellerine kıyasla 1 milyon token başına 0,07 dolar ile %97 daha ucuz olmayı başarmış. Bu, çok daha uygun maliyete çok yüksek düzeyde yapay zekâ özellikleri sunabileceği manasına geliyor. Bilhassa işletmeler için kullanımında çok fark yaratacağını söyleyebiliriz. Ayrıyeten düşük güç tüketimi, Ascend 910B yapay zekâ çipinin %82 civarında kullanımı üzere şeyler de tezler ortasında.
Görme yeteneklerinde düzgünleşme, daha az halüsinasyon
Yine açık kaynaklı olacak modelin görsel yeteneklerinin de büyük manada iyileştirileceği aktarılıyor. O denli ki COCO görsel testlerinde %92,4 seviyesine çıkabilmiş. Bu da insan düzeyine yakın görüş yeteneklerine sahip olabileceği manasına geliyor olabilir. Gelen yenilikler sayesinde halüsinasyonun, yani yanlış bilgi vermenin de azaldığını görme ihtimalimiz fazla.
DeepSeek’in yeni modelinin ne vakit tanıtılacağı konusunda şimdilik bir bilgi yok. Birtakım argümanlar, bu hafta gelebileceği tarafında. Yanlışsız çıkıp çıkmayacağını bekleyip göreceğiz.