每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录

每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录


然而,巨大的芯片面积仅容纳了 80 亿参数的模型,这与当前万亿参数的前沿模型相比显得“容量有限”。 这表明,为了实现极致的硬连线速度,Taalas 在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。 在针对 DeepSeek R1 模型的测试中,通过 30 芯片的集群配置,实现了高达 12000 TPS / User 的吞吐速度(据公司称,GPU 目前的技术约为每人每秒 200 个 tokens)。


Published at: 2026-02-21 01:35:04

Still want to read the full version? Full article