第一科技网 › 首页 › 科技› 查看内容

腾讯混元开源端到端AI音效生成模型

时间：2025-08-28 17:12:23 来源：科技快报网收藏阅读量：6319

8月28日，腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley，该模型通过输入视频与文字描述即可自动生成电影级音效，打破传统AI视频“无声”局限。

据官方演示显示，其能精准匹配引擎轰鸣、树叶沙响等复杂声效，能“看懂画面、读懂文字、配准声音”，实现“画面-文字-声音”协同，带来沉浸式视听体验。

技术亮点包括:

多模态理解:同步解析视觉内容与语义指令，动态生成环境音、拟音等；

工业级应用:适配短视频、影视制作、游戏开发等领域，降低专业音效设计门槛。

此次开源延续腾讯混元“技术普惠”战略，开发者可通过官方渠道获取模型权重及工具链。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

精彩阅读

精选资讯

11月全球热门移动游戏下载量排行：《地铁跑酷》重

微盟尹世明：视频号将成全新战场，商户全域运营

2022-12-16

川航A320飞机安装Viasat机载互联网设

2022-12-16

两连板步步高：公司战略将做重大调整或致5亿元

2022-12-15

《自然》公布影响2022年科学进程十大人物

2022-12-15

欧洲最快超算与量子计算机“联姻”

2022-12-15

阅读排行

热门文章

华为侯金龙：能源流与信息流融合

[科技]安全搭建远程办公体系！贝锐向日葵分级授权+操作追溯解痛点

[科技]美团发布2025年Q2财报：营收918亿元，用户交易频次再创新高

[科技]“装备”你的每一步京东3C数码全程护航哈尔滨马拉松

[科技]开学季装机，Ultra5230F搭配技嘉B860M电竞雕打造高性价比学习

[科技]知乎Q2营收7.17亿元连续三个季度实现盈利

[动态]北京大兴榆垡镇：以千万客流红利为契机，抢占京津冀旅游商业新高地

[科技]AI智能成标配，苏宁易购引领空调换新潮

[科技]苹果秋季新品发布会定档9月10日天猫上线直播预约

[科技]餐饮品牌加盟新探索：流浪泡泡推出风险兜底计划

[动态]浙文影业为子公司提供不超1.35亿元担保

腾讯混元开源端到端AI音效生成模型

精彩阅读

全球包销1亿枝供应链效率提升三倍京东超市全球直采重构鲜花供应链...

又见跨界造车！首款车型对标布加迪威龙...

8月29日开“装”！苏宁易购启动金秋厨电节...

夸克启动最大规模教育计划，惠及2000万教师和5000万大学生...

美国倍捷珠海厂获授权组装伊顿JBX连接器，进一步扩充亚洲产线...

ROGXG248QSG610Hz电竞显示器，疾速高刷畅爽来袭！...

飞渡科技再度登顶数字孪生平台市场，空间智能引领产业变革新浪潮...

活力中国调研行湖北天门服装电商构建起完整产业链...

三利谱2025年半年报解读：营收增长41.97%，新产能释放驱动未来成长...

数禾科技：十年磨砺铸就科技金融新范式...

11月全球热门移动游戏下载量排行：《地铁跑酷》重

微盟尹世明：视频号将成全新战场，商户全域运营

川航A320飞机安装Viasat机载互联网设

两连板步步高：公司战略将做重大调整或致5亿元

《自然》公布影响2022年科学进程十大人物

欧洲最快超算与量子计算机“联姻”

关于我们

联系我们