

AI视频这条赛谈,最近有点冷,Seedance 2.0堕入版权争议,OpenAI关停Sora ,让这条赛谈上空昏昧密布。
就在这个时候,阿里牵出来了一匹黑马。
2026年4月,HappyHorse-1.0冲上Artificial Analysis榜首,在文生视频和图生视频(无音频)两个赛谈同期压过字节、快手等敌手。
张迪在2025年11月追念阿里巴巴,接任淘天集团畴昔生涯实验室看重东谈主一职,并顺利向阿里姆妈CTO郑波陈诉责任。
也便是说,张迪从追念到闯出容貌,中间也就隔了5个月傍边。
关键在于,HappyHorse和阿里的千问一样,绽放了可商用的开源版块。
当今千问在阿里什么地位?它是阿里集团级的中枢通用大模子底座、AI战术的整个中枢载体。阿里现如今的一切,皆是在围绕千问进行布局。
是以HappyHorse对阿里的兴趣兴趣,可能也远不啻是一个刷榜秀本领的模子那么简便。
不外在交融阿里的想法之前,咱们应该先来聊聊,张迪是谁。
01
从阿里到快手再回阿里
张迪毕业于上海交通大学猜度机专科,本硕连读,2010年毕业后加入阿里巴巴,耐久看重阿里姆妈的大数据和机器学习工程架构。
阿里姆妈作念的是告白、推选、搜索和调动,背后是大领域数据、大领域分发和复杂工程系统。这些东西听起来莫得大模子那么吵杂,但它们恰是其后中国互联网公司素质AI东谈主才的方位。
好多真实能把模子作念成产物的东谈主,并不是纯正从实验室里出来的。他们更早阅历过搜索、推选、告白、实质分发这些系统的训练。
这我纵脱举几个例子你就懂了。谷歌CEO桑达尔·皮查伊,他便是作念搜索栏和Youtube实质推选出身的,微软的CEO萨提亚·纳德拉,他在微软一运行斥地的便是必应搜索引擎和微软告白体系。
因为这些系统每天皆在处理海量用户步履,也条目模子能在真实业务里解析运行。它不允许工程师只作念一个面子的demo,它将就你作念出真实有用的东西出来,还必须在蔓延、资本、成果、响应之间反复弃取。
张迪在阿里的十年,约略便是在这么的环境里渡过的。那时候外界还莫得把通盘事情皆叫作大模子,但阿里里面早就有一套围绕数据、算法和工程化的素质场。
2020年,张迪离开阿里去了快手。
其时的短视频平台,也曾从流量竞争参加本领竞争阶段。张迪在快手历任本领副总裁、大模子与多媒体本领团队看重东谈主,其后主导了可灵大模子的底层架构研发和诈欺落地。

可灵对快手的兴趣兴趣口舌常要紧的。
可灵让快手从昔时的 “实质分发平台”,升级为 “实质坐褥基础设施提供商”,构建了 “创意生成-视频制作-一键分发-流量变现-数据迭代” 的完好闭环
2025年4月,快手建造可灵AI行状部,并升级为公司一级部门,顺利向 CEO 程一笑陈诉,与短视频主业务平起平坐。
是以当他在2025年9月瞬息加入B站,又在两个月后回到阿里时,这个动作就很难只当作一次正常的东谈主才流动。
B站需要视频本领,阿里一样需要视频本领,仅仅阿里的需求更复杂。
快手作念视频生成,无非便是分发。但阿里如果作念视频生成,那背后牵连的关键就多了去了。有电商、告白、直播、云做事和外洋商家。
前文提到,张迪2025年11月追念阿里后,出任淘天集团“畴昔生涯实验室”看重东谈主,职级P11。
如斯安排下来,阿里味照旧很浓的。它莫得把视频模子简便放在一个纯参谋部门里,其位置反而更围聚淘天这么一个来回现场。
换句话说,HappyHorse从构念念运行,便是一个强调落地,和阿里现存生态绑定的产物。
五个月后,HappyHorse出现了。
这个速率确乎快,阿里给了张迪一个新的业务场景和团队,他把视频模子这条道路再次买通。
他既不是从零运行参加AI视频,也不是单纯从外部空降到阿里。
他的职业旅途像一条绕出去又绕回来的线。先在阿里学会大领域交易系统如何运转,再去快手把视频生成作念成产物,然后又回到阿里,把这套智力放进更大的交易机器里。
好多公司皆在抢大模子东谈主才,但真实稀缺的东谈主,开云官方体育app官网往往是能同期交融模子、业务和组织的东谈主。
单纯会素质模子的东谈主好多,单纯会讲战术的东谈主也好多,难的是有东谈主知谈一个模子从本判辨线运行,到架构想象,到素质推理,到产物出口,到临了被商家和用户用起来,中间每一步会在那里卡住。
HappyHorse把张迪再行推到台前,也让阿里昔时几年相对散播的AI叙事有了一个更具体的东谈主物进口。
02
开源模子如何打败闭源巨头
HappyHorse真实引起眷注的点,在于它获得太俄顷了。
在视频生成这条赛谈上,外洋有Runway、Pika、Luma、Google的Veo,国内有字节的Seedance、快手的可灵。阿里排不上号。
是以当HappyHorse刚屠榜的时候,专家以致更雅瞻念敬佩说这是某创业公司斥地的模子,也不肯意敬佩这是阿里的模子。
HappyHorse在文本转视频和图像转视频两个赛谈皆处在第一梯队,文本转视频Elo分数为1333,图像转视频Elo分数为1392。
Artificial Analysis的榜单本人会随用户盲测束缚变化,后续页面分数也有更新,然则它确乎在用户偏好测试中压过了一批更早出名的闭源模子。
这事其实挺反常的。世俗来说,视频生成是最吃钱、吃数据、吃算力的标的之一。
闭源大厂不错把数据、模子细节、推理系统和产物体验藏在我方平台里,捏续作念里面迭代。
开源模子则要濒临更多实践完了,它的参数要能公开,推理要能跑起来,社区要能复现,成果还要经得起横向相比。
是以在HappyHorse出现之前,开源视频模子大多数皆是玩物,输出的视频不够解析,东谈主物还时常会出现漂移。
HappyHorse有150亿参数、40层息争自提防力Transformer架构,把文本、视频、音频三种模态的token放进归拢个序列里齐集建模。
这个路数和千问越过像,这也就讲授了为什么张迪仅用5个月就把HappyHorse弄出来了,很可能是沿用千问留住来的高质地原生多模态素质步调。
像Sora这种非多模态原生的视频生成模子,时常会出现东谈主物嘴在动,声息慢半拍的情况。何况有时候东谈主物神色很丰富,易游app但口吻分离。东谈主物还有可能在声息发出之前就行为了。
HappyHorse评分高的原因就在于,它通过原生多模态措置了这个问题。
HappyHorse原生救济英语、正常话、粤语、日语、韩语、德语、法语等多种语言的唇形同步,词造作率也被拿来和同类开源模子相比。
张迪为什么要这么作念?我的交融是,如果阿里想让视频生这项本领参加告白、电商、短剧、老师和直播,就不成只靠画面漂亮。
它要能言语,要能配音,要让声息和画面同期建造。
另一个关键点是资本和速率。
HappyHorse在单张H100 GPU上生成5秒1080p视频约需38秒,并秉承DMD-2蒸馏本领把去噪模范压到8步。
这是视频生成交易化绕不开的一起坎。模子成果再好,如果生成一条短视频资本太高、恭候太久,就很难参加商家日常责任流。

商家不会为每个商品等半天,也不会为几十个测试素材支付过高资本。
是以HappyHorse的兴趣兴趣不仅仅“能生成”,还在于它试图把生成速率和推理资本压到可用区间。
对斥地者来说,开源意味着不错自托管、微调、接入我方的产物。对平台来说,开源也会带来更多社区响应
一个闭源模子的越过主要依靠公司里面团队,一个开源模子会被斥地者拿去作念多样奇怪测试,问题长远得快,校阅标的也会变多。
Artificial Analysis的视频竞技场秉承用户偏好投票,好多时候不单看某一个本领贪图,更看用户在两段视频之间更心爱哪一个。
自然,张迪还不成太骄傲,一次榜单登顶不等于长久最初。
竞争敌手不会停在原地。HappyHorse当今赢下的仅仅一场公开测试,还不是通盘这个词干戈。
HappyHorse如果仅仅一个能刷榜的模子,它的兴趣兴趣有限。可如果它能成为阿里云、淘天业务共同使用的视频生成底座,它就会酿成一个进口。
是以说HappyHorse打败闭源巨头,最特兴趣兴趣的方位并不仅仅分数最初。真刚巧得眷注的是,它让阿里找到了一种再行参加视频生成牌桌的容貌。
它莫得先作念一个面向C端用户的APP,也莫得只在里面作念演示,而是顺利拿开源模子接受全行业训练。
这场告成就怕会捏续很久,但张迪让外界改变了对阿里在视频生成模子上的判断。
新的问题酿成了,阿里准备把这项智力用到那里?
03
HappyHorse对阿里的兴趣兴趣
HappyHorse最顺利的落点,是电商。
昔时专家谈AI视频,最容易预料影视、短剧、告白大片、创作家用具。诚然,这些皆是实打实的大市集,不外它们离阿里的主业务还有一段距离。
阿里的上风不在于我方作念一个视频社区,也不在于让正常用户每天大开一个AI视频APP消磨时间。阿里真实有上风的方位,是它手里有中国最密集的商品、商家、来回和告白系统。
这亦然为什么好多东谈主皆珍贵说HappyHorse出生于淘天集团的“畴昔生涯实验室”。
淘天每天濒临的是商家如何卖货,商品如何被看见,用户为什么点进来,又为什么下单。HappyHorse放在这里,专家自然就会预料它能不成提升商品实质坐褥着力,能不成提升调动,能不成帮平台多作念生意?
对一个正常商家来说,视频实质一直是个弯曲事。
拍一条30秒的商品视频,你要找场景、找模特、打光、编著、配音。大品牌不错请团队,中小商家更多时候只可我方凑。
好多商品卖点并不复杂,问题在于没东谈主把卖点拍出来。它们放在白底图里皆很正常,一朝参加具体场景,用户才会意志到它能用来作念什么。
前一阵在外洋,太阳能喷泉泵这个产物卖爆了,它原来仅仅庭院小件,成果也就那么回事。然则被AI视频包装成鸟浴盆、鱼池和儿童浴缸里,酷炫的喷水玩物后,通盘东谈主皆在疯抢。

AI莫得改变商品本人,却改变了用户交融商品的容貌。它把“功能评释”酿成了“使用场景”。
这正好击中电商实质的痛点。
商品页里写满参数,用户就怕有耐性看;主播讲半天,用户也就怕敬佩。但一条十几秒的视频,如果能把场景讲廓清,调动着力可能会高好多。
更要紧的是,AI视频不错批量生成。商家不错为归拢个商品生成儿童版、家庭版、节日版、户外版,也不错为不同国度生成不同语言、不同东谈主物、不同场景。
这对阿里的兴趣兴趣,比单纯作念一个视频生成用具要大。岂论是淘宝,照旧天猫,上头皆有无数商家,也皆有无数商品数据和来回响应。
一个AI视频用具如果只知谈生成漂亮画面,它很快会酿成素材软件;如果它能知谈这个商品在什么场景下更容易被点击,什么案牍更容易带来加购,什么视频前几秒更容易留住用户,它就会接近电商操作系统的一部分。
阿里比其他视频生成模子公司多出来的,恰是这个响应闭环。
商品图、细则页、评价、问答、搜索词、点击率、加购率、退款原因、直播间停留时间,这些东西看起来破裂,却皆是素质电商实质智力的燃料。
HappyHorse如果接入这些响应,就不错从“帮商家生成一条视频”,进化到“帮商家生成更可能卖货的视频”。
面向淘天,它不错作念主图视频、商品场景短片、直播切片、假造主播和营销素材。
昔时一个商家上新,可能只上传几张图,最多再拍一条粗陋短视频。以后它不错把商品图、卖点、评价和东谈主群标签交给系统,让系统生成多条不同版块的视频,再用真实投放和成交数据筛选出更灵验的那一条。
这个经过如果跑顺了,平台实质供给会显明增多,中小商家的实质门槛也会下跌。
不外,AI视频带货也有风险。它不错放大卖点,也可能放大幻觉。一个喷泉泵在AI视频里喷得很高,实践里够不上那样的成果。
阿里的契机不该是放浪商家用AI造梦,要点应该放在商品参数、实拍素材、买家评价和平台审核上,让生成实质有规模。
3月下旬,OpenAI晓谕关停Sora孤独诈欺和相干API。原因很实践,视频生成太烧钱,用户留存撑不起资本,OpenAI要把算力放回编码、企业做事和机器东谈主标的。
Sora倒在了交易账上。
字节也在另一头碰到弯曲。Seedance 2.0诚然成果也很猛,然则因为版权问题,字节暂停了Seedance 2.0的全球发布。
模子素质得越强,就越容易踩进版权、肖像权和素质数据的泥潭。
这时再看张迪带队作念出的HappyHorse,它有廓清的交易场景。而且阿里手里的商品图、商家素材、实拍视频和来回响应,自然比影视IP更适宜可控生成。
是以HappyHorse的价值易游,不单在榜单。它给AI视频找了一个更稳的落点。
豪门国际官网娱乐网