Yerli yapay zeka Cosmos T1 Hazır
Cosmos T1: Türkçe Düşünebilen Yeni Nesil Yapay Zeka
Yıldız Teknik Üniversitesi’ndeki Cosmos araştırma ekibi, Türkçe doğal dil işleme (NLP) görevlerinde yüksek performans hedefleyen Cosmos T1 adlı açık kaynaklı yapay zeka dil modelini resmen duyurdu.
9 milyar parametreye sahip Cosmos T1, Türkçe’nin karmaşık yapısını ve kültürel bağlamını derinlemesine öğrenme yeteneğiyle öne çıkıyor. Model, Google’ın Gemma 2 altyapısı üzerine inşa edildi ancak Türkçe için özel olarak optimize edildi.
Performans ve Teknik Özellikler
- Türkçe GSM8K testinde %77,41 doğruluk oranı yakalayarak, 70 milyar parametreli Llama-3.1-70B (%66,13)** ve Gemma-2-9B (%63,10) modellerini geride bıraktı.
- Eğitim sürecinde 200 milyar token’dan fazla Türkçe veri işlendi.
- Masked Language Modeling (MLM) yöntemiyle Türkçe’ye özgü ek-fiil yapıları ve sondan eklemeli sözdizimi üzerine odaklandı.
- 12 katmanlı decoder-only Transformer mimarisi ile geliştirildi.
Açık Kaynak ve Kullanım
Cosmos T1, Hugging Face platformunda açık kaynak olarak erişime sunuldu. Ayrıca Cosmos LLM web sitesi üzerinden ücretsiz olarak test edilebiliyor.
“Düşünen Model” Vurgusu
Yıldız Teknik Üniversitesi Yapay Zeka ve Veri Mühendisliği Bölümü Öğretim Üyesi Prof. Dr. Mehmet Fatih Amasyalı, Cosmos T1’in en önemli farkını şöyle açıkladı:
“ChatGPT gibi modeller cevap üretirken doğrudan yanıt verir. Cosmos T1 ise önce düşünüyor, ardından cevap üretiyor. Bu düşünce sürecini Türkçe olarak adım adım görebiliyoruz. Böylece performans çok daha yüksek oluyor.”
Amasyalı ayrıca, birçok sektörün verilerini dış firmalarla paylaşmak istemediğini, bu nedenle on-premise çözümler'in önem kazandığını vurguladı. Cosmos T1 ve diğer açık ağırlıklı modellerin, şirketlerin kendi bilgisayarlarında özgürce kullanılabileceğini belirtti.
Sonuç olarak : Cosmos T1, Türkçe için özel olarak optimize edilmiş ilk “düşünen” yapay zeka modeli olarak dikkat çekiyor. Hem akademik dünyada hem de sektörlerde, Türkçe’nin yapısal zorluklarını aşan bu yeni nesil modelin, yerli yapay zeka ekosistemine güçlü bir katkı sağlaması bekleniyor.
Cosmos T1 Benchmark Sonuçları
| Cosmos T1 | 9B | 77,41 | Türkçe için optimize edilmiş, “önce düşün sonra cevapla” yaklaşımı |
| Llama-3.1-70B | 70B | 66,13 | Çok daha büyük parametreli olmasına rağmen Cosmos T1 geride bırakıyor |
| Gemma-2-9B | 9B | 63,10 | Cosmos T1 aynı parametre boyutunda daha yüksek performans sergiliyor |
Teknik Özellikler:
Mimari: 12 katmanlı decoder-only Transformer
Eğitim Verisi: 200 milyar token’dan fazla Türkçe veri
Yöntem: Masked Language Modeling (MLM)
Odak Noktası: Türkçe’nin ek-fiil yapıları ve sondan eklemeli sözdizimi
Kullanım: Hugging Face üzerinden açık kaynak olarak indirilebilir ve kendi bilgisayarında çalıştırılabilir. Cosmos LLM web sitesinde ücretsiz test edilebilir.
Haberler kategorisinden son haberler
İlgilendiğiniz başlıklardan geri kalmayın.
Yorumlar (0)
Topluluğumuzla düşüncelerinizi paylaşın.
Henüz yorum yapılmamış. İlk yorumu sen yaz!
Yorum yapabilmek için giriş yap.
Üye değil misin?