苹果发布开源 AI Model – MGIE 以文字指令编辑图像

育碧 • 2024年2月9日 12:41 • 投稿

苹果近日发布了一款新的开源 AI Model，名为「MGIE」，能够根据自然语言指令来编辑图像。 MGIE 的全名为 MLLM-Guided Image Editing，它运用多模态大型语言模型（MLLMs）来解读用户命令，并进行像素级的操作。该 AI Model 能够处理各种编辑方面，包括 Photoshop 风格的修改、全局照片优化以及局部编辑。

苹果发布开源 AI Model – MGIE 以文字指令编辑图像

MGIE 是苹果与加州大学研究人员合作的成果，这 AI Model 在 2024 年的 ICLR（国际学习表示会议）上被接受发布，ICLR 是 AI 研究领域的顶尖会议之一。论文展示了 MGIE 在提升自动度量和人类评估方面的有效性，同时保持了竞争性的推理效率。

MGIE 的基础理念是运用能够同时处理文本和影像的强大人工智能模型——多模态大型语言模型（MLLMs），来增强基于指令的影像编辑。 MLLMs 在跨模态理解和视觉感知的回应生成方面展现出了显著的能力，但它们尚未广泛应用于图像编辑任务上。

MGIE 以两种方式将 MLLMs 整合进图像编辑过程中：首先，它使用 MLLMs 从用户输入中导出富有表达力的指令。这些指令简洁明了，为编辑过程提供了明确的指导。例如，给定输入「使天空更蓝」，MGIE 能够产生「将天空区域的饱和度增加 20%」的指令。

其次，它使用 MLLMs 生成视觉想象，即所需编辑的潜在表征。这一表征捕捉了编辑的本质，可以用来指导像素级的操作。 MGIE 采用了一种新颖的端到端训练方案，共同优化指令导出、视觉想象和影像编辑模块。

赞 (0)

打赏

微信扫一扫

育碧认证作者

0 0

投稿

《王权与自由》团队预定 27 日揭露游戏开发内容今日抢先曝光预告影片

韩国游戏厂商NCSOFT20日预告，将在12月27日揭露旗下研发中PC/家用主机新作《王权与自由（THRONE AND LIBERTY）》（以下简称TL）开发方向等细节，今日抢先曝…

Expreview超能网
2023年9月27日
投稿

我的门派大道遗种有什么作用大道遗种使用方法介绍

本篇文章由小编给您带来的我的门派大道遗种有什么作用和大道遗种使用方法介绍的具体内容分享。在我的门派游戏随着玩家门派规模等级的扩大，可以在探索战斗中获得各种类型的道具材料，那么其中的…

uuu9
2023年8月31日
多人线上对战游戏《我的英雄学院 ULTRA RUMBLE》PS4版OBT将于5月26日开放！确定追加饭田天哉、上鸣电气、拳藤一佳

以《我的英雄学院》開發的基本免費大逃殺遊戲《我的英雄學院 ULTRA RUMBLE》（僕のヒーローアカデミア ULTRA RUMBLE，PS4/Nintendo Switch/Xb…

Toy-编辑部
2023年9月26日 • 投稿
投稿

《纽时》评为年度最强平板！苹果万元 iPad 改款曝光

因不错的 CP 值和足以应付一般需求的硬件规格，《纽约时报》旗下产品评选网站《Wirecutter》，意外将定价台币万元出头的苹果第 9 代基本款 iPad 评选为目前最好的平板，…

Toy-编辑部
2023年9月25日
投稿

假冒 NFT投资窃个资骗钱！资安业者揭露3种常见网络诈骗手法

农历春节即将到来，随着年前尾牙和年终奖金发放，看准许多民众把握时机加码投资发大财的心理，诈骗集团利用近期讨论热度极高的非同质化代币（NFT）布下陷阱，藉由假冒的NFT网站与投资项名…

游研社
2023年8月25日
AI 大对决！微软抢在 Google 紧急发布会同日突袭举办发布会

让我们正式把 2/8 订为 AI 日（什么这名称被特斯拉用过了？）

IGN
2023年10月2日 • 投稿

发表评论

登录后才能评论