Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?


近期,在网上掀起了一场AI画画大战,各式AI绘手纷纷加入战场,包含了由NVIDIA提出的GauGAN、OpenAI提出的Dall-E以及VQ-GAN+CLIP和LatentDiffusion Models,甚至在5月时,GOOGLE也推出过Imagen来应战。 其实这是一种透过简单文字描述输入,即可快速生成拟真影像的技术。

然而仅过了一个月,谷歌 再度派出最新的 AI 灵魂绘师「Parti」上场,Parti 全名为「Pathways Autoregressive Text-to-Image」,这次与 Imagen 使用的是不同的技术路线,Imagen 所采用的是由文字到图像的产生,而 Parti 是一个自回归模型,它的方法首先将一组图像转换为一系列代码,类似于拼图。 然后将给定的文本提示转换为这些代码并「拼成」一个新图像,也就是转化成「序列到序列」,类似于机器翻译。 这使得它能够受益于大型语言模型(如PaLM),这对于处理长而复杂的文本提示和生成高质量的图像至关重要。

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?

而且本次的 Parti 可通过 200 亿组输入数据进行训练,另外在训练过程中,谷歌 表示会加入一些干扰,让人工智能在训练过程产生不同的训练效果,这也是为了避免生成结果千篇一律,同时也能让生成结果精度提高。 但目前 谷歌 并未透过公众内容训练 Parti,避免产生潜在偏见风险,不过相信未来公开后会出有很多梗图、迷音图的问世。

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?

↑ Parti 制作出来的图像会随着训练资料数量的增加,产生更精准、细致的图像。

谷歌 也分享了一些 Parti 所绘制出来的图像,像是照着梵高的《星夜》并以 67 个单词来叙述,而 Parti 果然是个 AI 灵魂绘师,不负众望的把各种风格都绘制出来。

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?

但也不是没有出错的时候,Parti 目前对否定句的判定还不足够强大,下面提供一些失败案例:「一个没有香蕉的盘子,和一旁没有橙汁的玻璃杯」,结果给出的画面是「我全都要」。 另外由于需要训练的关系,在还没有接触过的项目中,常常会犯一些常识性的错误,包括缩放、比例等问题。

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?
Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?

而其实据 Parti 表示,这类的创作其实满简单的,下面就分享一些例子给大家看吧!

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?


↑ 一只浣熊穿正装,头戴礼帽,拄着枴杖,拿着个垃圾袋、一只老虎戴着列车长的帽子,手里拿着一块滑板,上面有一个阴阳符号。

Google AI 灵魂绘师 「Parti」 来了! 迷因梗图要更疯狂了吗?
(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论