Hailuo 2 模型介绍
基本信息
2025 年 6 月 18 日,上海人工智能企业 MiniMax 正式发布其新一代视频生成模型 Hailuo 2(也有资料称 Hailuo 02)。它是目前全球唯一一个可以实现类似体操这种高度复杂场景的视频大模型,支持原生 1080P 高清视频的直接输出,在场景快速变换中的动作流畅,且能呈现细微表情,拥有较强时空一致性和物理逻辑性,并实现 SOTA 指令遵循12。
核心架构与训练优化
开发团队持续探索更为高效的视频生成模型架构,最终形成了 Hailuo 02 的核心设计——Noise – aware Compute Redistribution(NCR)。这一架构的核心在于优化计算资源分配,从而提升整体效率。为了让模型能够拟合更多数据,开发团队将训练数据量扩展至前一版的 4 倍,同时大幅提升了数据质量和多样性1。
能力表现
指令遵循能力强
常用视频生成模型常出现“听不懂”或“做不准”用户复杂、精细描述的情况,而 Hailuo 2 在这方面表现出色。例如输入“中世纪骑士在暴雨城堡庭院单膝跪地,突然抬头拔剑,镜头从俯拍急拉至面部特写,背景雷声轰鸣,悲壮史诗感”,它能将激烈的动作、细微的情感和宏大的氛围一并爆发式呈现,精准执行电影工业级视听语言;输入“暴风雨中,巨浪猛烈撞击黑色礁石,浪花飞溅,乌云缝隙透出金色夕阳”,它能复现自然界中最具冲击力的动态美学;输入“阴云笼罩的破败巨型工厂突发剧烈爆炸……低角度仰视镜头突显其压迫感,背景是持续崩塌燃烧的工厂废墟”,它能在多个特效方面有出色表现,如爆炸火球规模感、碎片物理飞溅、动态烟尘透光效果等3。
生成效果稳定
通过测试“一只金毛猎犬在客厅里走来走去。一位男子走进画框,坐在沙发上女子的旁边。男子身穿燕尾服”等提示词,发现 Hailuo 2 生成效果相对稳定,和网友用相同提示词的结果惊人一致(除了长相和窗外的小孩)4。
理解复杂指令
面对要素多、跨度大以及可能陌生的词,Hailuo 2 都能处理得得心应手。比如在短短 6s 内横跨春、夏、秋、冬的指令,生成的视频有纪录片质感,能完成时空拼接;对于“两个人模仿 AI 打架,中间将某一场景转换为黑白草图效果以展现富含夸张意味的‘灵魂画手’玩法”的指令,也能很好地实现4。
图生视频能力
在图生视频方面取得突破,可用于日常工作如广告营销。例如生成各种虚拟人物在不同场景中宣传 Labubu 玩偶的宣传片,还能考查其文字生成能力,初步来看效果不错,没有出现常见的拼写错误;将自己和风景图拼接,配上简单提示词,能营造“身临其境”的感觉;根据第一帧图,能精准抓住“让雨滴静止”以及“悬停后刹那间恢复”等关键时刻4。
版本与价格
目前,Hailuo 2 提供三种版本:768p – 6s、768p – 10s 和 1080p – 6s。得益于架构上的多项创新,其价格相较于国内外同类产品更具竞争力1。
未来规划
Hailuo 2 被视为一个全新的起点,接下来团队将推出除文字生成视频、图像生成视频之外的高级功能,还会持续优化模型性能,推动视频生成技术的进步,为创作者提供更优质的工具支持1。
数据评估
本站i For AI – 人工智能AI工具,一站式导航提供的Hailuo 2都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由i For AI – 人工智能AI工具,一站式导航实际控制,在2024年12月16日 下午7:09收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,i For AI – 人工智能AI工具,一站式导航不承担任何责任。