⚡ Ajans Online
GÜNCEL

Ses, görüntü ve metni aynı anda işleyebiliyor

Çinli teknoloji devi, ‘Omnimodal’ yani her şeyi aynı anda kavrama kapasitesine sahip yeni modelini duyurdu. Günlük hayattan örnek vermek gerekirse, bu sistem si

Çinli teknoloji devi, ‘Omnimodal’ yani her şeyi aynı anda kavrama kapasitesine sahip yeni modelini duyurdu. Günlük hayattan örnek vermek gerekirse, bu sistem sizinle sohbet ederken bir yandan da gösterdiğiniz bir videoyu izleyip oradaki yazıları okuyabiliyor. Üstelik tüm bunları araya başka bir çevirici program sokmadan tek başına hallediyor. Piyasadaki birçok AI aracı genellikle sadece yazı veya dinlemeyle çalışıyor. Ancak Qwen 3.5 Omni tüm bu iletişim yollarını kendi içinde doğal bir şekilde çözüyor. Yeni model kullanıcılara Plus, Flash ve Light olmak üzere üç farklı sürümle sunuluyor. Bahsi geçen tüm seçenekler ‘Context Window’ denilen ve asistanın tek seferde aklında tutabildiği bilgi miktarını belirleyen bir kapasiteye sahip. Qwen 3.5 Omni, milyonlarca saatlik işitsel ve görsel verilerle donatılmış. Arkasındaki bu zorlu eğitim süreci, onu piyasadaki rakiplerinden sıyırıp bambaşka bir kulvara taşıyor. En çok göze çarpan yenilik ise modelle konuşunca kendini belli ediyor. Altyapıda ‘Semantic Interruption’ adı verilen özel bir mekanizma çalışıyor. Yani Qwen 3.5 Omni yalnızca kullanıcının sesine odaklanırken, arkadan gelen sesleri sallamıyor. Kulaklıklarda arka plan seslerini süzen filtre gibi düşünebilirsiniz. Böylece yapay zeka sohbet esnasında gereksiz yere duraksamıyor ve karşılıklı iletişim çok daha pürüzsüz bir hâl alıyor. Ses kopyalama yeteneği de çiçeği burnunda modelin en güçlü silahlarından biri. Kullanıcılar kendi seslerinden kısa bir kaydı Qwen 3.5 Omni’ye yükleyerek asistanın aynı tonda cevap vermesini sağlayabilir. Bununla birlikte 3.5 sürümü gerçek zamanlı internet araması da yapabiliyor. Bilmediği bir konu hakkında varsayım yapmak yerine anlık olarak internetten en taze bilgileri buluyor. Qwen 3.5 Omni yapılan zorlu testlerde kendi alanındaki popüler rakiplerine adeta toz yutturdu. Özellikle dilleri anlama ve çeviri yapma konularında büyük bir üstünlük kurdu. Eskiden üç ayrı uygulamanın dakikalarca uğraşıp ortaya çıkardığı bir video analizini de bir dakika içinde bitirdi. (Kaynak: CNN)