Midjourney 学会从图像中反推提示词,AI 绘画进入新阶段

Midjourney 学会从图像中反推提示词,AI 绘画进入新阶段

在各种 AIGC 产品层出不穷的今天,让 AI 画一张图已经不是什么难事。

尽管有着「无需动笔」、「零门槛作画」等一系列优点,但很多人并不能借助 AI 之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。

Prompt 方法是一门极深的管理学问:如果不输入精准的命令描述,产生结果就可能十分随机,甚至与预期相去甚远。 但归根结底,如何给出完美的 prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在 prompt 上的成本,很少有人清楚。

正因此,AIGC 产业衍生出了一种专门的职业 ——prompt 工程师。 前段时间,初创公司 Anthropic 在旧金山招聘「prompt 工程师和图书馆员」,给出的薪水高达 33.5 万美元。

或许,这一过程也能让 AI 代劳呢? AI 会做的比人类更好吗?

最近,AI 绘画神器 Midjourney 就上新了一个功能:/describe。

「今天,我们发布了一个 /describe 命令,可让您将图像转换为文字。」▲ 「今天,我们发布了一个 /describe 命令,可让您将图像转换为文字。」

具体来说,Midjourney 学会了从图像中反推 prompt。 如果你在 Midjourney 上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去产生自己想要的图片变体。

Midjourney 是一款 2022 年 3 月发表的 AI 绘画工具,此前刚刚推出第五代版本,由于产生效果十分「炸裂,大量用户迅速涌入,以至于该公司不得不关闭了免费注册通道。

这一次功能的更新意义重大:

  • 改进可造访性:通过用于 Web 显示的 ALT 文本元素,图像描述让有视觉障碍或阅读困难的人更容易访问数字内容;
  • 增强的可搜索性:描述可以通过搜索引擎启用更好的搜索功能和索引;
  • 用于标题:可以包含描述,使图像更加清晰;
  • 详细 prompt:描述可用于创建更详细的 prompt 以制作新变体,可以为快速工程提供灵感。
(1)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论