第一科技网

关注我们

ewm

扫码关注官方微信

手机版

设为首页加入收藏

热搜: 资讯业界科技互联

第一科技网 › 首页 › 科技› 查看内容

联想将单台服务器运行大模型性能推向新高

时间：2025-03-18 08:34:52 来源：中国经济网收藏阅读量：7517

今天，联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版) DeepSeek大模型时，可实现极限吞吐量6708token/s，将单台服务器运行大模型的性能推向了新高。

据悉，依托联想万全异构智算平台，联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式，对大模型从预训练、后训练到推理的全流程进行持续优化，在单台部署DeepSeek 671B大模型的联想问天WA7785a G3上实测最高吞吐量达6708 token/s。

在模拟问题对话场景时，最高可支持并发数158，TPOT 93毫秒, TTFT 2.01秒；而在模拟代码生成(上下文序列长度512/4K )时，并发数可达140，TPOT 100毫秒, TTFT 5.53秒。意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用，是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s之后，单机部署该大模型推理性能的又一次突破。

此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。此结果也并非最终结果，联想与AMD还在持续尝试深度调优新方法，实现更高调优突破。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

Es916

精彩阅读

精选资讯

11月全球热门移动游戏下载量排行：《地铁跑酷》重回第一

11月全球热门移动游戏下载量排行：《地铁跑酷》重

微盟尹世明：视频号将成全新战场，商户全域运营要抢占先机

微盟尹世明：视频号将成全新战场，商户全域运营

2022-12-16

川航A320飞机安装Viasat机载互联网设备，率先实现Ka卫星网络批量装机

川航A320飞机安装Viasat机载互联网设

2022-12-16

两连板步步高：公司战略将做重大调整或致5亿元闭店亏损

两连板步步高：公司战略将做重大调整或致5亿元

2022-12-15

《自然》公布影响2022年科学进程十大人物北京大学基因组学研究人员曹云龙入选

《自然》公布影响2022年科学进程十大人物

2022-12-15

欧洲最快超算与量子计算机“联姻”

欧洲最快超算与量子计算机“联姻”

2022-12-15

阅读排行

1 大客厅“神机”一机氧全屋为球迷

2 AI技术成手机竞争新焦点

3 美团数据赋能x2B;小红书内容

4 追觅H40Ultra洗地机：「

5 京东携头部品牌举办高端手机壳品

6 产教融合、科教融汇激发世界级成

7 JJ斗地主冠军杯S7春季赛淘汰

8 华锐精密688059.SH：公

9 具身智能获突破，人形机器人量产

10 2025 年 315 行业风险

热门文章

华为侯金龙：能源流与信息流融合，共建绿色低碳城市

华为侯金龙：能源流与信息流融合

[资讯]光伏业面临内卷挑战，需供需两端综合发力促良性竞争

[资讯]民政部长发声：构建一刻钟养老服务圈，助力城乡养老服务网络完善

[科技]智己汽车、斑马智行、饿了么三方牵手：首个“AI生态座舱”要来了

[科技]智邦国际墨工湖MES：点亮制造业数智进化觉醒之路，实现生产力的基因重组

[科技]百度旗下智能助手文小言全面接入最新大模型和DeepSeek支持多种模型自

[动态]张掖：税费服务为重大项目建设“铺路搭桥”

[科技]百度智能云助力首个AI生成反网暴宣传片

[科技]吉利申请注册DEEP系列商标涵盖科学仪器、运输工具和网站服务

[科技]美丽背后的代价：基因“搬家”引发的双刃剑效应

[动态]欧派家居全球订单破5000万个武汉蔡甸智造基地发展势头强劲

关于我们
关于我们业务范围免责声明网站地图
联系我们

联系邮箱：bgm1231@sina.com

Copyright (C) 2014- one.kjcnn.cn. All Rights Reserved

版权所有：第一科技网备案号：皖ICP备2023007381号

本站部分信息资源来自网络转载，如有侵权，请来函说明！

ftqrcode

扫描二维码关注我们