微軟推出首款內部人工智慧模型:用於超快速語音的 MAI-Voice-1 和用於指令執行任務的 MAI-1-Preview
簡單來說 微軟推出了其首個內部人工智慧模型,用於快速語音生成的MAI-Voice-1和用於指令追蹤任務的MAI-1-preview。
微軟人工智能 微軟致力於開發和整合人工智慧技術的部門Copilot,宣布推出其首個高保真、富有表現力的語音生成模型MAI-Voice-1。該模型目前已在Copilot Daily和Podcasts以及全新的Copilot Labs體驗中上線,讓用戶探索富有表現力的語音和敘事能力。
MAI-Voice-1 在單揚聲器和多揚聲器場景下均能提供自然的音頻,其速度之快令人驚嘆,單 GPU 即可在不到一秒的時間內生成一分鐘的語音,使其成為目前最高效的語音生成系統之一。該模型支援諸如互動式「選擇你自己的冒險」故事或個人化引導式冥想等應用,展現了語音作為 AI 伴侶主要介面的潛力。
微軟 AI 啟動其首個經過全面訓練的基礎模型 MAI-1-Preview 的公開測試
除此之外,微軟人工智慧部門已在LMArena(一個廣泛使用的社群模型評估平台)上啟動了MAI-1-preview的公開測試。這標誌著該部門首個經過全面訓練的基礎模型,並提供了即將整合到Copilot的功能的早期預覽。 MAI-1-preview是一個內部混合專家模型,在約15,000塊NVIDIA H100 GPU上進行了預訓練和後訓練,旨在處理指令遵循並為日常任務提供有用的響應。
該模型將逐步引入 Copilot 中選定的基於文字的用例,使 Microsoft AI 能夠收集回饋並優化效能。團隊結合內部模型、合作夥伴貢獻和開源創新,在每天數百萬次的互動中優化結果。 MAI-1 預覽版也已向值得信賴的測試人員開放,並透過 API 存取應用程式收集關於其優勢和改進領域的見解。
展望未來,微軟人工智慧部門計劃進一步推進該模型,同時根據不同的用戶意圖和場景客製化一套專用模型。該部門的目標是繼續開發領先的人工智慧解決方案,並讓全球用戶都能輕鬆使用。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
CandyBomb x BOOST:充值或交易,即可瓜分 8,332,000 BOOST!
質押借貸狂歡日第 24 期:借入 USDT、USDC,立享最高 40% 的 APR 折扣
Bitget 現貨槓桿新增 JTO/USDT!
CandyBomb x WLFI:合約交易瓜分 200,000 WLFI!
加密貨幣價格
更多








