Qwen3.5-Omni от Alibaba — модель, которая видит, слышит и говорит. И это не демо
Alibaba выпустила Qwen3.5-Omni — нативно мультимодальную модель на 397 миллиардов параметров, которая обрабатывает текст, изображения, аудио и видео, отвечает голосом в реальном времени и умеет вызывать внешние инструменты.