因为我们是在闭环仿真这个系统搭建起来的过程中积累了一套非常完整对车辆行为判断的一套系统,这套系统甚至还用了刚才提到的这些云端的32B模型,不仅是蒸馏完以后给车端用,在云端用这些大的模型去做推理、判断这个车在仿真环境里的行为是否正确,同时我们从很多的维度,包括“安全、舒适、合规、效率”等,对车辆的行为做一个评价,总体来给出一个打分,我们也叫reward,目的是告诉他这个车在仿真环境里。 如果你没有很好世界模型、仿真环境,这个世界模型不是部署在车端的,是在云端的,云端的世界模型真的是帮助我们算法训练的,模拟了一个真实的物理世界,我们现在是场景的生成,在结尾处我们给它秀了一段1公里×1公里的完整的区域仿真,如果再做的完善一点,我们最终的目标是让我们算法在模拟世界里跑极品飞车,像《SimCity》,是模拟的一个城市环境。 所以我刚才秀了一段我们3D资产,就是每一个里面的交通参与者,我们是精致到我都有他的3D模型,并且赋予他Agent的智能体,所以他在我的环境里不管是静态的东西,还是动态的东西是一个完整的、真实的物理世界的“纯仿真、纯模拟”,如果达到这种程度,我把我的车,我把我的算法在这里面,就相当于他在这个环境下跑一天等于你在真实世界里跑好几年的训练速度,那时候会非常快。
Published at: 2025-08-04 05:03:46
Still want to read the full version? Full article