马斯克也要打造自己的视频生成模型了?? 就在最近,xAI收购了一家视频生成初创公司,这家仅4个人的公司过去两年打造出了Hotshot这款产品。 ![]() 据公告介绍,Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。 一看这架势,网友们纷纷想起了老马在今年1月的一场直播活动中掷下的豪言: 预计将在几个月内发布Grok视频模型 而且就在Hotshot联创amp;CEO公布上述消息之后,老马也*时间跑来卖关子: 酷炫视频AI即将到来! 期待值被拉满的同时,众人也齐刷刷表达了对Hotshot团队的祝贺: 那么,这是一家怎样的团队呢?为什么它能被马斯克“看上”? 答案这就揭晓—— 4人团两年打造“Sora” 概括而言,Hotshot之所以能入老马的眼,原因显然在于两方面: 一是“小团队也有大能量”,据悉Hotshot团队一共只有4个人,但他们在13个月里连续训练出了3个视频生成模型,且获得了一定程度的用户关注;二是虽然成立不久,但投资者中不乏Reddit联合创始人Alexis Ohanian等大佬。 4人中有两位是联合创始人。 联创amp;CEOAakash Sastry,和另一位联创amp;CTOJohn Mullan(左边)早在2012年就相识了。 认识之前,前者正在构建一个视频聊天应用,后者正在尝试打造视觉通讯应用。 不过,在看到Aakash Sastry的视频聊天应用失败之后,两人一致意识到: 我们需要创造一个让人们在网上表达自己的同时,也感到舒适和自由的环境。 于是,Hotshot逐渐诞生了。 2017年,两人共同成立了一家公司——Natural Synthetics,开始构建各种不同的社交应用。 到了2023年1月,他们正式在iOS应用商店发布了Hotshot。 直到后来逐渐被视频生成吸引,因此他们又开始训练视频生成模型。 和之前类似,一开始他们也打算基于开源模型构建,不过后面意识到:1)基础模型需要大幅改进;2)为了自由构建引人入胜的用户体验,需要对底层模型拥有控制权。 于是,他们正式决定自研视频模型。 在过去的13个月里,他们训练了3个不同的视频模型: *个Hotshot-XL:耗时3个月开发,每秒生成8帧视频,开源后至今每月约有2万名新的开发者和艺术家使用; 第二个Hotshot Act-One:耗时5个月开发,生成3秒8fps的视频,基于2亿个公开视频训练而成; 第三个Hotshot:耗时4个月开发,生成最长10秒的720p视频,限文生视频。 按照Hotshot发布时的说法,在各种提示评估中,70%的情况下用户更喜欢Hotshot的结果,而不是其他开源文生视频模型。 另外,从CEO Aakash Sastry公布的消息来看,Hotshot的投资者包括Stripe前高管Lachy Groom、Reddit联合创始人Alexis Ohanian以及SV Angel在内的风险投资机构。 至于具体融资次数和规模,Hotshot尚未公开披露,而且也不清楚整个Hotshot团队是否会集体加入xAI。 马斯克想开发自己的视频生成模型? 事实上,早在今年1月,马斯克在一场直播活动中就透露了自研视频生成模型的想法: 对于自家的Grok模型一直没有视频生成功能这事儿,老马本人和用户都不太满意。 而要解决这个问题,通常来说有两条路可走: 要么直接接入其他家模型,要么自研。 从Grok之前的一些倾向来看,他们主要选择*种方案,比如其Grok-2的文生图功能,就是通过与此前备受瞩目的Flux深度融合实现。 然而现在,老马明显转向了。 为了和OpenAI、谷歌等展开长期竞争,xAI最终也是走上了自研之路,开始通过收购进一步布局。 不过不管怎样,对于我们普通用户来说,期待Grok的视频生成功能就完事了! |
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
2022-12-16
2022-12-16
2022-12-15
2022-12-15
2022-12-15