
阿里巴巴發表全新開源大型語言模型Qwen3-Omni,具備文字、影象、音訊及影片處理能力,並以其免費的特性吸引開發者。
在全球人工智慧技術競爭日益激烈的背景下,阿里巴巴(NYSE:BABA)近日正式推出其最新開源大型語言模型Qwen3-Omni。該模型不僅能夠即時響應文字與自然語音,還支援同時處理文字、影象、音訊和影片,標誌著其成為首個原生端到端的多模態AI系統。
根據公司發布的訊息,Qwen3-Omni可進行119種語言的文字互動,19種語言的語音理解,以及10種語言的語音生成。此外,使用者可以透過系統提示自由調整模型的回應風格、角色及行為屬性,顯示出其靈活性和適應性。
阿里巴巴強調,Qwen3-Omni在36項音頻及視聽基準測試中,達到了32項開源最先進技術(SOTA)的成果,並在22項總體指標上超越了Alphabet的Gemini-2.5-Pro等強大封閉源模型。這使得Qwen3-Omni在市場上獲得了一席之地,尤其是在最近由微軟支援的OpenAI推出GPT-4o後,"omni"模型的趨勢愈加明顯。
值得注意的是,Qwen3-Omni採用Apache 2.0授權協議,允許開發者免費下載、修改和部署,甚至可用於商業應用,使其在開源社群中佔有優勢。隨著Google也推出類似功能的Gemma 3n,未來的競爭將更加白熱化。阿里巴巴的Qwen3-Omni無疑是對當前AI市場的一次重要衝擊,並可能改變開發者的選擇方向。
點擊下方連結,開啟「美股K線APP」,獲得更多美股即時資訊喔!
https://www.cmoney.tw/r/56/9hlg37






