中国梦公益网
当前位置:首页 > 励志正能量

DeepSeek-R1发布一周年之际,新模型“MODEL1”曝光

2026-01-21 21:09:34         5   0
DeepSeek-R1发布一周年之际,新模型“MODEL1”曝光。DeepSeek在GitHub更新FlashMLA代码,横跨114个文件中有28处提到MODEL1,与V32作为不同的模型出现。
已知V32是DeepSeek-V3.2,MODEL1很可能是新的架构。代码中的具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处不同。
此前有消息称DeepSeek将在2月中旬春节前后发布下一代旗舰模型。(量子位)

〖全民公益-赠人玫瑰,手留余香!〗

声明: 网页文章内容均来自互联网,不代表本站观点 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告