• JYlo938
第一科技网 首页 科技 查看内容

豆包提出全新稀疏架构推理成本较MoE最高可降83%

时间:2025-02-13 07:33:28 来源:科技快报网 收藏 阅读量:12243   

近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2—6倍。

更重要的是,该架构能够将推理成本最高降低83%。

该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

Es916
精彩阅读