Yapay zeka alanındaki rekabet dünya genelinde hızla sürerken, Çin merkezli teknoloji şirketleri yeni model geliştirme çalışmalarına devam ediyor. Bu kapsamda Alibaba bünyesinde faaliyet gösteren Qwen ekibi, yeni Qwen3.5 Small Model Series ailesini duyurdu. Tanıtılan yeni model serisi, yalnızca performansıyla değil düşük donanım gereksinimiyle de dikkat çekiyor. Şirket tarafından paylaşılan bilgilere göre bu modeller akıllı telefonlarda bile yerel olarak çalışabiliyor. Böylece yapay zeka uygulamalarının yalnızca bulut sistemlerine bağlı olmadan doğrudan cihaz üzerinde çalışması mümkün hale geliyor. Bu yaklaşım, internet bağlantısı gerektirmeden çalışan yapay zeka sistemlerinin daha geniş kullanım alanına ulaşabileceğini gösteriyor. Qwen3.5 Small serisinin kompakt boyutuna rağmen performans açısından daha büyük modellerle rekabet edebildiği ve bazı testlerde daha iyi sonuçlar elde ettiği ifade ediliyor.

Dört Farklı Model Tanıtıldı

Qwen3.5 Small Model Series kapsamında dört farklı model yer alıyor. Seride Qwen3.5-0.8B, Qwen3.5-2B, Qwen3.5-4B ve Qwen3.5-9B modelleri bulunuyor. Özellikle 0.8B ve 2B parametreli modeller düşük güç tüketimi gerektiren mobil cihazlar ve edge sistemler için geliştirildi.

Serinin 4B modeli ise 262.144 token’lık yerel bağlam penceresi ile dikkat çekiyor ve hafif yapay zeka ajanları için güçlü bir altyapı sunuyor. Ailenin en güçlü modeli olarak gösterilen 9B versiyonu ise akıl yürütme odaklı kompakt bir model olarak konumlandırılıyor. Paylaşılan test sonuçlarına göre bu model, bazı kıyaslamalarda kendisinden çok daha büyük parametre sayısına sahip açık kaynaklı modelleri geride bırakabiliyor.

Yerel Yapay Zeka Deneyimi Hedefleniyor

Yeni model ailesinin en dikkat çekici özelliklerinden biri, mobil cihazlarda yerel olarak çalışabilmesi oldu. Paylaşılan bilgilere göre 2B parametreli modelin iPhone 17 Pro Max üzerinde yerel olarak çalıştırıldığı görülürken, 4B sürümünün de farklı mobil cihazlarda test edildiği aktarıldı. Ayrıca Android tarafında Poco F5 gibi cihazlarda da yerel kullanımın mümkün olduğu ifade edildi.

Alibaba’nın geliştirdiği bu modellerde standart Transformer mimarisinden farklı bir yaklaşım kullanılıyor. Gated Delta Networks adı verilen doğrusal dikkat mekanizması ile seyrek Mixture-of-Experts yapısı bir araya getirilerek daha verimli bir mimari oluşturuldu. Bu yapı sayesinde işlem verimliliği artarken gecikme süresinin azaltılması hedefleniyor.

Ayrıca Qwen3.5 serisinin doğal çok modlu eğitim yaklaşımıyla geliştirildiği ve görüntü ile video analizinde de kullanılabildiği belirtiliyor. Şirket, model ağırlıklarının ve yapılandırma dosyalarının Apache 2.0 lisansı ile geliştiricilere sunulduğunu açıkladı. Böylece ticari kullanım, değiştirme ve yeniden dağıtım gibi işlemler için ek bir lisans ücreti gerekmiyor.