Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba’nın Yeni Hibrit Yapay Zeka Modeli Qwen3 Tanıtıldı




Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü duyurdu. Şirketin “hibrit” yapısıyla öne çıkan bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modelleriyle yarışıyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere karşı güçlü performans

Qwen3 ailesi, 235 milyardan 600 milyon parametre sayısına kadar değişen çeşitli modellerden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini etkileyen önemli bir ölçüttür. Alibaba’ya göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini bazı karşılaştırmalarda geride bırakıyor. Qwen3 modelleri, OpenAI’nin o3 ve o4-mini gibi en üst düzey yeni modellere üstün gelmiyor, ancak yine de güçlü bir performans sergiliyorlar.

Ancak en güçlü model henüz kamuya açık değil. Bunun yerine, Qwen3-32B gibi daha küçük ancak yine de etkileyici performans gösteren modeller Hugging Face ve GitHub üzerinden indirilebilir durumda. Qwen3 modellerine ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcıları aracılığıyla da erişilebilmektedir.

Hibrit yaklaşım benimseniyor




Qwen3 modellerinin en dikkat çekici özelliklerinden biri olan “hibrit” yapısı, modelin karmaşık sorunlara karşı düşünme süreci uygulamasını ve basit sorulara hızlı cevap vermesini sağlar; yani model, gerektiğinde düşünür. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebilir. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak adlandırıyor. Bu tür çözümleri yakın zamanda görmeye başladık.

Ayrıca, bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellere dağıtır, böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerler.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dilde destek sağladığını ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri bulunmaktadır. Bu geniş veri havuzu sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü performans sergilemektedir. Örneğin, LiveCodeBench gibi yazılım karşılaştırmalarında OpenAI’ın o1 modelini geride bırakmayı başarmaktadır. Alibaba, Qwen3’ün araç çağırma yeteneğinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu belirtiyor.

Related Posts

UCI Dağ Bisikleti Eliminatör Dünya Şampiyonası, Sakarya’da gerçekleştirildi

UCI Dağ Bisikleti Eliminatör Dünya Şampiyonası, Sakarya’nın ev sahipliğinde 24 ülkeden 71 sporcunun katılımıyla gerçekleştirildi. İsveçli Edvin Lindh erkekler kategorisinde, Ukraynalı Mariia Sukhopalova ise kadınlar kategorisinde altın madalyanın sahibi oldu.

İrem Su Kocaoğlan Avrupa arenasına çıkacak

Modern Pentatlon Milli Takımı’na seçilen Malatyalı sporcu İrem Su Kocaoğlan, İspanya’nın Barselona kentinde düzenlenecek U-17 Avrupa Şampiyonası’nda Türkiye’yi temsil edecek.

Dünya tarihini değiştirecek icat! Herkesin hayal ettiği şey gerçek oldu

Avustralya’nın Sydney Üniversitesi’ndeki bilim insanları düşünceleri beyin dalgalarından okuyarak metne dönüştüren bir yapay zeka modeli tasarladı. Çalışmada, beyin aktivitelerini ölçen giyilebilir elektroensefalogram (EEG) başlığı kullanıldı. Yapay …

ChatGPT, premium olan o özelliğini tüm kullanıcılarına sunacak!

Gelişen teknoloji ile birlikte yapay zeka kullanımının da yaygınlaşması, teknolojide rekabeti kızıştırdı. OpenAI ChatGPT platformunda nisan ayında açıkladığı hafıza özelliğini tüm kullanıcılarının erişimine açık hale getirdi daha öncesinde Plus ve …

iPhone’da tepki çeken isim değişikliği yolda

Apple, yalnızca cihazlarıyla değil, stratejik kararlarıyla da gündem yaratmaya devam ediyor. Şirketin yakın zamanda işletim sistemi isimlendirmesinde büyük bir değişikliğe gitmeye hazırlandığı ortaya çıktı.

Borsa İstanbul’da teknoloji zirvesi: DevSecOps başladı

Dünyanın farklı yerlerinden teknoloji uzmanlarını “AI for DevSecOps” temasıyla buluşturan ve Borsa İstanbul ev sahipliğinde gerçekleştirilen DevSecOps Days İstanbul etkinliğinin açılışında gong çalındı. Etkinlikte gongu, Bilişim Teknolojileri (BT) Derneği Yönetim Kurulu Başkanı Mehmet Ali Serttaş, Borsa İstanbul Genel Müdür Yardımcısı Erdinç Tutam, Takasbank Genel Müdür Yardımcısı Taşkın Özer, Sanayi ve Teknoloji Bakanlığı Bilgi Güvenliği Daire Başkanı Burcu Doğan Kasacı ve Carnegie Mellon Üniversitesi’nden Hasan Yaşar birlikte çaldı.