“一直到2010年,我们去研究一些CUDA的东西的时候,还是会觉得各种问题,之前大家都是英特尔的X86,很成熟了,一做CUDA,这也不行,那也不行,我们就开玩笑怎么做这么烂的? ”一位在早年间就专注于英伟达CUDA做软件研究的从业者告诉凤凰网科技,这样的状态持续了仅五六年,到2015年,想再找CUDA的bug就很难了。 该集群核心指标包括:训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,“在多项关键精度指标上达到国际主流水平”。
Published at: 2025-12-21 14:05:24
Still want to read the full version? Full article