HappyHorse 1.0(快乐小马)是由 Alibaba Group ATH 创新事业部推出的多模态视频生成模型。该模型于 4 月初以匿名身份亮相 Artificial Analysis Video Arena 榜单,并在文生视频(Text-to-Video)与图生视频(Image-to-Video)两大赛道中同时位列第一。4 月 10 日,阿里官方正式公布其为 HappyHorse 1.0。

目前,灵龙AI已正式接入 HappyHorse 1.0,支持在线体验及 API 调用,开发者与企业用户可快速接入相关能力。

音画同步:原生联合生成,覆盖语音、音效和环境音

传统 AI 视频生成通常采用“画面生成 → 音频生成 → 后期对齐”的分阶段流程:先生成无声视频,再通过独立模型完成配音、音效与背景音频,最后再进行音画时序同步。由于涉及多个模型与多轮处理,流程越复杂,音画不同步的问题就越容易出现,尤其在人物口型匹配、节奏卡点以及撞击类音效等对时间精度要求较高的场景中,更容易产生延迟或错位。

HappyHorse 1.0 将音频视为视频生成的原生组成部分,一次推理可同时输出三类声音:

  • 与口型匹配的语音

  • 场景关联的音效(脚步声、雨声、碰撞声等)

  • 环境氛围音(背景噪声、音乐氛围)

多语言唇形:7 种语言原生支持

HappyHorse 1.0 内置 7 种语言的唇形同步能力,包括英语、普通话、粤语、日语、韩语、德语与法语。模型会针对不同语种分别建模语音细节与面部动作,实现更加自然精准的口型匹配效果。

对于出海团队而言,这意味着只需基于同一套提示词,即可快速生成多语种版本的产品介绍视频,并自动完成对应语言的口型同步,无需再为每种语言单独进行配音制作或后期唇形校正,大幅降低多语言视频内容的制作成本与时间。

灵龙AI已上线HappyHorse API

灵龙AI已上线 HappyHorse 1.0,支持 API 调用。

第一步:申请API KEY

https://dzwlai.com/linlongai/#/?i=8NCBS8_WXFF

第二步:发起视频创作任务:

接口地址:

/_open/ai/task/api/happyhorse/gene2video接口参数信息:

{    "modelName": "happyhorse-1.0",    "prompt": "写实风格,晴朗的蓝天之下,一大片白色的雏菊花田,镜头逐渐拉近,最终定格在一朵雏菊花的特写上,花瓣上有几颗晶莹的露珠",    "duration": 3,    "resolution":"720p",    "aspect_ratio": "16:9",    "watermark":false,    "callbackUrl":""

响应信息:

{    "code": 200,    "msg": "您已成功提交创作任务,目前剩余并发任务数为3",    "data": {        "id": "1909553892857782274",        "status": "create"    }}

第三步:获取任务信息

接口地址:

/_open/ai/task/api/getState?ids=2050187272183156738响应信息:

{    "code": 200,    "msg": "操作成功",    "data": [        {            "id": "2053367098310389762",            "status": "finished",            "progress": 100,            "cld2VideoUrl": "https://file.dzwlai.com/aitask/api/happyhorse/000/000/100/e4e35d628ad7c2f8fc8d43a59976f3e2.mp4?v=70"        }    ]}

史文章

Suno AI API接入 - 将AI音乐接入到自己的产品中,支持120并发任务

[灵龙AI API] 申请访问令牌 - 第1篇

[灵龙AI API] AI生成视频API:文生视频 – 第2篇

单图特效实战:用[灵龙AI API]玩转AI生成视频 – 第3篇,特效来袭

文生图实战:用[灵龙AI API]玩转AI生成图片 – 第4篇

图生图实战:用[灵龙AI API]玩转AI生成图片 – 第5篇

AI翻唱实战:用[灵龙AI API]玩转AI翻唱 – 第6篇

文生3D实战:用[灵龙AI API]玩转AI 3D模型 – 第7篇

AI MV/AI MV对口型/AI照片唱歌:用[灵龙AI API]玩转AI MV – 第8篇

AI数字人: 支持 "说话"、"唱歌" 、“表演”三种场景:用[灵龙AI API]玩转AI 数字人 – 第9篇

Seedance 2.0 API 已上线 | 支持「人像视频生成」|支持100并发 | 满血版 [灵龙AI API]

如何接入GPT Image2 API[灵龙AI API]

Seedance 2.0 API 文生视频  |支持100并发 |  [灵龙AI API]

一键生成 AI MV ,支持字幕 |灵龙 AI 正式开放 MV API 能力 -  第12篇

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐