DeepSeek推出NSA機制提升長上下文訓練與推理效率
作者:Panews

PANews 2月18日消息,DeepSeek宣布推出NSA(稀疏注意力機制),該機制與硬體高度一致且支援本機訓練,旨在實現超快速的長上下文訓練和推理。透過針對現代硬體的最佳化設計,NSA在加速推理速度的同時顯著降低預訓練成本,且不會影響模型效能。
根據官方介紹,NSA在通用基準測試、長上下文任務以及基於指令的推理中表現優異,與完全注意力模型相比表現相當甚至更佳。
0
0
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與
您也可能喜歡
Bitget 將捐贈 1,200 萬港元,支持香港大埔火災救援及重建工作
Bitget Announcement•2025/11/28 09:06
Bitget現貨杠桿關於暫停 ELX/USDT 杠桿交易服務的公告
Bitget Announcement•2025/11/27 08:19
網格新人福利:領取 150 USDT 雙重歡迎禮
Bitget Announcement•2025/11/27 04:40
Bitget現貨杠桿關於暫停 BEAM/USDT, ZEREBRO/USDT, AVAIL/USDT, HIPPO/USDT, ORBS/USDT 杠桿交易服務的公告
Bitget Announcement•2025/11/27 03:00
加密貨幣價格
更多Bitcoin
BTC
$91,239.6
+0.04%
Ethereum
ETH
$3,030.17
+0.44%
Tether USDt
USDT
$1
+0.05%
XRP
XRP
$2.21
-0.29%
BNB
BNB
$890.61
-0.25%
Solana
SOL
$139.38
-1.67%
USDC
USDC
$1
+0.04%
TRON
TRX
$0.2802
+0.31%
Dogecoin
DOGE
$0.1512
-1.32%
Cardano
ADA
$0.4251
-2.12%
如何出售 PI
Bitget 上架 PI:在 Bitget 上快速購買或出售 PI!
立即交易
還不是 Bitget 用戶嗎?新用戶可獲得價值 6,200 USDT 的迎新大禮包
立即註冊