#deepseek新模型能否再次爆火#
从 R1 的全球爆火,到 V3.2 正面硬刚 GPT-5,DeepSeek 基本干了一件事:证明 AI 不是只能靠烧钱堆算力,也能靠架构和工程能力赢。
最近多家科技媒体都在放风:DeepSeek V4 已经在路上了,最快春节见。
我目前最被期待的,还是两点。
第一,是编程能力的再跃迁。
V4 被曝在代码生成、Debug、复杂工程理解上,已经全面超过 Claude 和 OpenAI 的新模型。更夸张的是,它能吃下“超长提示词”,直接喂整个开源仓库,让它做系统级重构。这已经不是“写代码”,而是开始参与软件工程本身了。
第二,是架构继续走极致效率路线。
V4 依然是 MoE,但在通信和稳定性上进一步优化,用更成熟的 mHC 把大模型“训得更省、更稳”。一句话总结:性能上去,成本不炸。在 GPT-5.2、Gemini 3 Pro 定价越来越离谱的当下,这点杀伤力很大。
更重要的是方向变了。
V4 很可能不再只是聊天或写代码,而是向“智能体”迈一步:能理解目标、拆任务、跑完整链路,而不是等你一步步指令。