您好,欢迎访问华体会在线登录的企业网站!

新闻动态

新闻动态

阿里云发布通义万相21创始生成汉字视频
来源:华体会在线登录    发布时间:2025-02-23 11:57:12

  日前阿里云方面宣告,旗下自研大模型通义万相迎来重磅晋级,已迭代至2.1版别(以下简称为万相2.1)。

  据了解,相较上一代,万相2.1的视频生成、图画生成两大才能均有明显提高。现在该模型已全面敞开,用户可在通义万相官网直接免费运用,一起个人开发者和企业用户还可在阿里云百炼调用通义万相API,进一步发明更丰厚的AI东西和运用。

  详细而言,在视频生成才能方面,万相2.1在大幅度杂乱运动、物理规则遵从、艺术体现等层面全方面提高,并在视频生成范畴范畴威望评测榜单VBench中以总分84.7%的成果登上第一。现在万相 2.1已支撑杂乱运镜,可复原磕碰、反弹、切开、揉捏等实在国际的物理规则。

  据悉,为精准了解和模仿物理国际,通义万相团队选用自研高效的VAE和DiT架构,有用增强万相2.1时空上下文联系建模才能。在全新架构下,万相2.1在大幅度的肢体运动和肢体旋转场景的视频生成上体现更安稳。值得一提的是,万相2.1在文字视频生成上完成了打破,成为首个支撑中文文字生成才能、且一起支撑中英文文字特效生成的视频生成模型,可满意广告规划、短视频等范畴的创造需求。

  在视频VAE方面,通义万相团队则规划了一种立异的视频编解码计划,即经过将视频拆分红若干块(Chunk)并缓存中心特征的方法,替代直接对长视频端到端的编解码进程,完成显存的运用与原始视频长度无关,然后可以支撑无限长1080P视频的高效编解码。

  而在图画生成才能方面,万相2.1支撑文生组图,可生成电影级分镜、四格漫画、情侣头像等。据了解,万相2.1选用IC-LoRA 图画生成训练方法,使用DiT架构增强了文本到图画的上下文才能。

GO TO THE TOP