DeepSeek V4

推理与逻辑能力

DeepSeek V4 · 子话题 3

共识较强
DeepSeek V4在多数推理和知识测试中表现强劲,但面对极复杂逻辑问题仍需提示或不如GPT顶级模型。
二进制喵同学的竹竿进门测试中V4需提示才答对、GPT一步到位;林亦LYi的刑侦推理试卷中V4全对、GPT反而答错。两位博主共同说明V4的推理能力在第一梯队,但与GPT互有胜负。
独家观察
V4在AI黑客大战中总分第三、漏洞修复能力第二,证明其在系统安全领域具备竞争力。
将V4的能力评估拓展到网络安全这一专业领域,丰富了对模型综合实力的认知。
相关视频