中立发布背景
DeepSeek V4 的发布经历了多次跳票,从2025年1月开始就不断有媒体爆料其即将发布。
博主提到路透社、金融时报等媒体每隔一阵子就会爆出V4将要发布的内幕消息,但每次都跳票。
来源:一个视频搞懂 DeepSeek V4!认同综合能力定位
DeepSeek V4 Pro 在知识类海龟汤测试中全部答对,表现优于GPT-5.4。
博主通过海龟汤测试考察AI的知识调用和灵活运用能力,DeepSeek V4 Pro四道题全部拿下,而GPT-5.4只答对一道。
来源:一个视频搞懂 DeepSeek V4!中立推理与逻辑能力
在2018年刑侦科推理试卷测试中,除GPT-5.4和Claude Sonnet 4.6外,包括DeepSeek在内的其他模型全部答对。
博主用修改表述后的推理试卷测试AI的推理能力,DeepSeek V4 Pro答对了所有题目。
来源:一个视频搞懂 DeepSeek V4!认同综合能力定位
在百万字长上下文测试中,只有DeepSeek和Gemini成功答对关于小说《全职高手》中冷门武器重量的问题。
博主将约100万字的小说内容输入给AI,测试其长上下文检索能力,DeepSeek和Gemini是唯二成功的模型。
来源:一个视频搞懂 DeepSeek V4!认同综合能力定位
DeepSeek V4 Pro 的文学写作能力独一档,对意境的理解水平高于其他AI。
博主通过1965年中国发现AI大模型的短篇小说和武侠小说测试,发现DeepSeek能烘托氛围,且展现了惊人的长上下文注意力进行前后呼应。
来源:一个视频搞懂 DeepSeek V4!认同前端开发与设计审美
在AI世界时钟网页测试中,DeepSeek V4 Pro 生成的时钟时分秒走时准确且精致。
博主用相同提示词测试各模型生成时钟网页的能力,DeepSeek与Claude、Gemini、GPT等处于同一水平线。
来源:一个视频搞懂 DeepSeek V4!认同前端开发与设计审美
在3D汽车变速箱演示网站测试中,DeepSeek V4 Pro 相对完整地实现了变速箱结构,表现优于GPT-5.4和Claude。
博主认为该任务对当前AI模型超纲,但DeepSeek在相对完整实现结构的AI中表现不错。
来源:一个视频搞懂 DeepSeek V4!不认同多模型协作方法论
DeepSeek V4 Pro 在编程智能体框架Open Code中存在适配问题,会反复重启服务或卡住。
博主在多用户系统计算器项目测试中发现,DeepSeek在执行过程中遇到问题导致后续对话无法进行,需要手动提示,不如Claude省心。
来源:一个视频搞懂 DeepSeek V4!中立多模型协作方法论
DeepSeek V4 Pro 的工程架构设计水准比Claude Sonnet 4.6稍强,但弱于Claude Opus 4.7。
博主对比三个模型完成的计算器项目,指出Opus 4.7在自动化测试和并发安全性等工程架构方面设计更全面。
来源:一个视频搞懂 DeepSeek V4!认同推理与逻辑能力
在AI黑客大战测试中,DeepSeek拿下总分第三,漏洞修复能力第二。
博主将DeepSeek接入AI黑客大战项目进行测试,证明其在系统安全方面能与顶尖模型竞争。
来源:一个视频搞懂 DeepSeek V4!认同模型效率
DeepSeek V4 Pro 具有极高的token利用效率,完成同样项目消耗的token远少于Claude Sonnet 4.6和Opus 4.7。
博主提供数据:计算器项目DeepSeek花了6万多token,Sonnet花了7万多,Opus花了10万多。
来源:一个视频搞懂 DeepSeek V4!中立综合能力定位
DeepSeek V4 没有让AI能力产生质的飞跃,而是探索在有限成本下发挥AI最大智能潜力。
博主综合所有测试给出定位,认为DeepSeek V4的方向是成本与效率的平衡,而非能力革命。
来源:一个视频搞懂 DeepSeek V4!中立地缘政治与芯片管制
美国从2022年10月起实施的三轮半导体出口管制,逐步禁止了A100、H100、H800、A800和H20等芯片对华出口。
博主梳理美国芯片禁令的时间线和影响,说明DeepSeek面临的算力困境。
来源:一个视频搞懂 DeepSeek V4!中立国产芯片与算力生态
2025年初DeepSeek尝试用华为昇腾910C训练下一代推理模型R2,但失败了。
博主披露DeepSeek在国产芯片适配上的挫折,华为工程师团队协助排查也未能解决问题。
来源:一个视频搞懂 DeepSeek V4!认同国产芯片与算力生态
DeepSeek花了2026年整个一季度与华为、寒武纪联合攻关,重写了V4模型底层部分模块,将华为芯片作为第一优先级设计。
博主引用The Information报道,说明DeepSeek为适配国产芯片投入的巨大工作量。
来源:一个视频搞懂 DeepSeek V4!中立国产芯片与算力生态
阿里、字节、腾讯在V4发布前夕采购了数十万颗昇腾950 PR用于部署DeepSeek模型,导致芯片价格上涨20%。
博主引用采购数据,说明DeepSeek对国产算力供应链的带动作用。
来源:一个视频搞懂 DeepSeek V4!认同价格与成本
预计2026年下半年昇腾950超节点批量上市后,V4 Pro的价格会大幅下调。
博主引用DeepSeek V4价格表下的小字,认为如果实现,DeepSeek将成为性价比最高的顶级模型。
来源:一个视频搞懂 DeepSeek V4!认同公司文化与团队态度
DeepSeek是一家不打卡、不到200人、没有明确绩效考核deadline、多数员工六七点下班的公司。
博主描述DeepSeek反直觉的公司文化,认为这种松弛感与其承载的巨大期望形成对比。
来源:一个视频搞懂 DeepSeek V4!