阿里巴巴推出開源AI模型Qwen3-Omni，挑戰美國科技巨頭競爭！

・ 2025 年 09 月 23 日

阿里巴巴發表全新開源大型語言模型Qwen3-Omni，具備文字、影象、音訊及影片處理能力，並以其免費的特性吸引開發者。

在全球人工智慧技術競爭日益激烈的背景下，阿里巴巴（NYSE:BABA）近日正式推出其最新開源大型語言模型Qwen3-Omni。該模型不僅能夠即時響應文字與自然語音，還支援同時處理文字、影象、音訊和影片，標誌著其成為首個原生端到端的多模態AI系統。

根據公司發布的訊息，Qwen3-Omni可進行119種語言的文字互動，19種語言的語音理解，以及10種語言的語音生成。此外，使用者可以透過系統提示自由調整模型的回應風格、角色及行為屬性，顯示出其靈活性和適應性。

阿里巴巴強調，Qwen3-Omni在36項音頻及視聽基準測試中，達到了32項開源最先進技術（SOTA）的成果，並在22項總體指標上超越了Alphabet的Gemini-2.5-Pro等強大封閉源模型。這使得Qwen3-Omni在市場上獲得了一席之地，尤其是在最近由微軟支援的OpenAI推出GPT-4o後，"omni"模型的趨勢愈加明顯。

值得注意的是，Qwen3-Omni採用Apache 2.0授權協議，允許開發者免費下載、修改和部署，甚至可用於商業應用，使其在開源社群中佔有優勢。隨著Google也推出類似功能的Gemma 3n，未來的競爭將更加白熱化。阿里巴巴的Qwen3-Omni無疑是對當前AI市場的一次重要衝擊，並可能改變開發者的選擇方向。