聚云动媒 6月30日讯,美团发布新一代万亿参数大模型LongCat-2.0,这是业界首个全流程依托国产算力完成训练推理的万亿级大模型,原生支持1M超长上下文,即将对外开源核心技术,其测试版此前调用量已跻身全球前三。 作为在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数1.6T,平均激活约48B,动态范围33B~56B),LongCat-2.0预训练数据规模超过30T tokens,覆盖中文、英文、多语言和代码等多类数据,原生支持1M超长上下文。 评分方面,在多项测试中都已接近主流期间模型水准。 |