新浪新闻客户端

Sora等视频大模型如何落地?美图给出解题思路

Sora等视频大模型如何落地?美图给出解题思路
2024年06月12日 16:03

  6月12日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到V5,将通过“AI工作流”进一步助力电商、广告、游戏、影视、动漫五大行业。并以该模型能力为基石,推出AI短片创作工具MOKI,助力用户实现多种视频场景的AI 短片创作。

  V5涵盖图像、视频、音频、文本大模型

  作为美图AI产品生态的基石,美图奇想大模型(MiracleVision)发布于2023年6月第二届美图影像节,它也是国内首个懂美学的AI视觉大模型,为美图全系产品提供AI模型能力。

  经过将近一年迭代,第三届美图影像节现场,美图公司创始人、董事长兼首席执行官吴欣鸿宣布美图奇想大模型(MiracleVision)已升级到V5版本,采用美图自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。

  美图奇想大模型(MiracleVision)的升级也进一步完善了美图的AI产品生态:应用层有AI图像、AI视频、AI设计、AI营销四大模块的多款产品,生态层由中国领先的视觉创意平台站酷和美图AI助手RoboNeo提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供AI模型能力。

  AI视频产品如何落地?奇想大模型助力MOKI给出答案

  今年2月,OpenAI发布文生视频模型Sora,并引发文生视频领域的激烈竞赛

  在Sora发布后,美图第一时间升级了视频大模型技术架构。从U-net架构升级到了更强的DiT架构。影像节现场公布的信息显示,升级后的美图视频大模型拥有6大亮点:更强的模型架构和更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。

  “作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。”吴欣鸿表示。原本需要实拍的视频,通过AI就可以生成,这个趋势正越来越近。

  美图还通过AI短片创作工具MOKI解决了视频大模型“故事成片难”、“可控性较差”的问题。与常规文生视频产品不同,MOKI深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的AI短片创作。

  吴欣鸿表示,MOKI让视频创作前所未有的简单高效,无论你是个人还是专业团队,只要你有想法,都能轻松地将它变成短片作品。

  (来源:News快报)

责任编辑:何奎良

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有