Google AI 灵魂绘师「Parti」来了！迷因梗图要更疯狂了吗？

近期，在网上掀起了一场AI画画大战，各式AI绘手纷纷加入战场，包含了由NVIDIA提出的GauGAN、OpenAI提出的Dall-E以及VQ-GAN+CLIP和LatentDiffusion Models，甚至在5月时，GOOGLE也推出过Imagen来应战。其实这是一种透过简单文字描述输入，即可快速生成拟真影像的技术。

然而仅过了一个月，谷歌再度派出最新的 AI 灵魂绘师「Parti」上场，Parti 全名为「Pathways Autoregressive Text-to-Image」，这次与 Imagen 使用的是不同的技术路线，Imagen 所采用的是由文字到图像的产生，而 Parti 是一个自回归模型，它的方法首先将一组图像转换为一系列代码，类似于拼图。然后将给定的文本提示转换为这些代码并「拼成」一个新图像，也就是转化成「序列到序列」，类似于机器翻译。这使得它能够受益于大型语言模型（如PaLM），这对于处理长而复杂的文本提示和生成高质量的图像至关重要。

而且本次的 Parti 可通过 200 亿组输入数据进行训练，另外在训练过程中，谷歌表示会加入一些干扰，让人工智能在训练过程产生不同的训练效果，这也是为了避免生成结果千篇一律，同时也能让生成结果精度提高。但目前谷歌并未透过公众内容训练 Parti，避免产生潜在偏见风险，不过相信未来公开后会出有很多梗图、迷音图的问世。