多名知情人士预计,DeepSeek 此次专门针对国产 AI 芯片优化 V4,将有助于提振本土芯片的市场需求,并加速在模型推理阶段(即利用已训练模型生成回答的过程)向华为、寒武纪等中国厂商转移,降低对英伟达和 AMD 芯片的依赖。 有接近 DeepSeek 计划的人士透露,公司预计将在下周发布 V4 的同时附上一份篇幅较短的技术说明文档,重点介绍关键改进点,并在大约一个月后推出更为详尽的技术报告,以系统性披露模型架构和训练方法。 就在本周早些时候,美国 AI 公司 Anthropic 指控 DeepSeek 及另外两家中国 AI 实验室对其模型实施所谓“蒸馏攻击”,即利用更强大模型的输出对小型模型进行训练,使后者在不直接使用同等级算力资源的情况下接近前者性能。
Published at: 2026-02-28 07:36:03
Still want to read the full version? Full article