Sora等视频大模型如何落地？美图给出解题思路

　　6月12日，在第三届美图影像节上，美图公司宣布美图奇想大模型（MiracleVision）已升级到V5，将通过“AI工作流”进一步助力电商、广告、游戏、影视、动漫五大行业。并以该模型能力为基石，推出AI短片创作工具MOKI，助力用户实现多种视频场景的AI 短片创作。

　　V5涵盖图像、视频、音频、文本大模型

　　作为美图AI产品生态的基石，美图奇想大模型（MiracleVision）发布于2023年6月第二届美图影像节，它也是国内首个懂美学的AI视觉大模型，为美图全系产品提供AI模型能力。

　　经过将近一年迭代，第三届美图影像节现场，美图公司创始人、董事长兼首席执行官吴欣鸿宣布美图奇想大模型（MiracleVision）已升级到V5版本，采用美图自研DiT技术架构，涵盖图像大模型、视频大模型、音频大模型和文本大模型，拥有更好的扩展性与更大的参数量，在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面，获得全方位提升。

　　美图奇想大模型（MiracleVision）的升级也进一步完善了美图的AI产品生态：应用层有AI图像、AI视频、AI设计、AI营销四大模块的多款产品，生态层由中国领先的视觉创意平台站酷和美图AI助手RoboNeo提供服务，模型层由美图奇想大模型（MiracleVision）为全系产品提供AI模型能力。

　　AI视频产品如何落地？奇想大模型助力MOKI给出答案

　　今年2月，OpenAI发布文生视频模型Sora，并引发文生视频领域的激烈竞赛。

　　在Sora发布后，美图第一时间升级了视频大模型技术架构。从U-net架构升级到了更强的DiT架构。影像节现场公布的信息显示，升级后的美图视频大模型拥有6大亮点：更强的模型架构和更大的参数量，结合更精准的语义理解，实现了更长的视频时长，动态连续性和画面稳定性也大幅提升。