MiracleVision奇想智能——美图秀秀旗下强大的视觉大模型

美图自研大模型3.0，正式发布，并且全面应用于美图旗下影像与设计产品。

这是自美图大模型面世100天后的最新迭代，相较于最初版本，3.0版能够生成更加真实细腻的画面细节。

如上这些生成能力，在美图秀秀上能直接体验。最近正流行的AIGC玩法，在其中都能找到。

美图秀秀可直接体验

美图自研大模型名叫MiracleVision（奇想智能）。其最显著的特点是更懂美学。

美图把长期积累的美学认知融入MiracleVision视觉大模型，并搭建了基于机器学习的美学评估系统，为模型生成结果打上“美学分数”，从而不断地提升模型对美学的理解。

目前MiracleVision3.0的最新能力在美图秀秀上即可体验。

而且操作很简单。比如涂鸦生图，寥寥几笔的草图再加上提示词，大模型都能“力挽狂澜”。

更加专业、控制更多的体验可以在AI视觉创作工具“WHEE”上体验。

比如“图生图”功能里，可以通过智能联想来生成完善的提示词。同时也能通过文字控制不希望呈现的内容。

以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。

在提升工作流效率方面，美图大模型MiracleVision现在进入了电商、游戏、动漫、广告和影视五大领域。

从6月首次面世以来，MiracleVision经历了三次迭代。

目前，美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张，已初步打造设计师生态；AI口播视频工具“开拍”月活跃用户数已突破35万；桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。

作为一家成立已有15年的产品公司，美图已经构建起了足够庞大的用户群体，能够通过在自身平台上试水新功能，快速得到市场反馈并快速调整效果，这样能让大模型更高效地和实际场景结合起来。

美图在这三方面已开始发力。

其一，美图快速迭代自研大模型，在100天时间里让模型生成效果更加丰富且可控，能在满足用户新鲜体验的基础上，提供更加具有实用价值的图像设计作品。

其二，美图选择了五大方向，面向生产者提供了AI设计工具。据透露，美图选择电商、游戏、动漫、广告和影视这几个行业，主要是看重了它们和互联网行业有更加原生的关系。这使得AI工具能更好融入其工作链路，整合工作流速度更快。

其三，变现能力。美图目前已经构建了一个创作者生态，这部分对在线AI工具感兴趣的创作者，可以将自己原创的AI视觉效果做成配方，在美图搭建的平台上售卖。这样一来，创作者能够获得更多收入，同时他们也能起到传播推广的作用，吸引更多人来使用AI视觉创作工具。

基于这些理解，今年美图正式提出了AI产品形态，包括底层、中间层和应用层。

底层为MiracleVision自研大模型。

中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成，分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。

应用层由普通用户更熟悉的各类应用APP构成。

三层架构的搭建，根本逻辑还是为产品出发。

以底层研发为例，美图旗下美图影像研究院（MT Lab）早在2010年成立。目前公司大模型研发相关人员为600人左右。

只需一句话，让你的文字变成画作。

Mojo是一种AI编程语言，旨在为开发人员提供一个更高效、更易用的编程环境。它结合了Python的语法和C++的性能，使得开发人员可以快速构建高质量的AI应用程序。

“PIKA LABS”只需输入文本内容，就可以自动生成相应的视频。这使得用户可以快速地将他们的创意转化为视觉内容，而无需具备专业的视频制作技能。

文心大模型的创意应用空间是百度推出的一个创意与探索社区，支持文本生成、文生图、智能对话等技能，可用于文化传媒、艺术创作、教育科研、金融保险、医疗健康等多个应用场景。

博特妙笔是一款基于人工智能技术的公文材料写作工具，旨在帮助公职人员快速、准确地完成法定性、事务性、规范性公文以及其他各类材料的创作。

Kittl是一款AI免费在线设计平台，用户可以通过简单操作，快速生成想要的图片和作品。

暂无评论...