

图源:推主@iamneubert
最近网上冲浪的时候发现了一个关于AI绘画如何诠释“美”这一概念的讨论,该讨论通过主流的AI绘画软件“Midjourney”进行实验,通过输入描述“美”的提示词,再对输出的图片进行统计和分析。最终的结论是,我们理解的“美”可能超出了AI当前的理解范围。

图源:群友“按时吃早饭”
我们常常会有这样的感觉:相比起用相机拍摄的照片,AI生成的图像总是显得不够真实,不论是真人特写还是其他类型的图像。细究其原因,我们会发现这是因为AI在创作图像时,倾向于创造完美的画面。例如,在没有特殊描述的情况下,AI生成的人像往往会有光滑的皮肤,没有皱纹,五官和脸型都会非常规整。然而,真实世界中没有完美的人,也正是这些“不完美”的部分让我们觉得人是真实、有深度的。

图源:群友“鼘”
所以今天通过几个简单实验,来探索一下AI眼中的“美”究竟是什么样子的:👇
一、/ 女性特征实验 /
本次实验中,首先选择标准的人像图片来观察AI的输出结果。在Midjourney选择最新的v5.1模型,并使用一个通用的提示词描述,不特意强调人物的肤色、头发颜色这些特征,咒语如下:
Editorial Portrait, Beautiful Woman, Photoshoot Lighting, Detailed Face, Black Background, Shot on Sony Alpha a7 III Camera With a Sony FE 24-105mm f/4 G OSS Lens –style raw专题肖像、美丽女人、拍摄灯光、精细面部、黑色背景、使用索尼Alpha a7 III相机和索尼FE 24-105mm f / 4 G OSS镜头拍摄——raw 样式。
这是一次比较简单且不够严谨的实验,但从此次的结果中,我们也可以从中分析Midjourney中关于女性的一些特征权重,下面是实验结果:

通过相同的提示词生成了 264 张人物肖像后,我们发现Midjourney 似乎对浅色眼睛的黑发女郎有强烈的偏好,或许这就是它认为的美女😂,详细数据如下:
- 头发特征黑发:75% (197);金发:23% (61);红头发:2% (6);其他:0%

- 眼睛颜色
浅色眼睛:68% (180);黑眼睛:32% (84)

- 肤色人种
白色人种86% (227);黄色人种11% (29);黑色人种3% (8)

- 人物年龄
年轻人:100%;中年人:0%
- 其他特征:皱纹:0%;疤痕:0%;眼镜:0%
进一步分析我们还发现:
- Midjourney 的多样性非常差,比预期的更极端,人像的特征经常会出现重复的现象。
- 似乎对于某些人像特征,需要提供更多的描述才能增加它出现在图片中的可能性,也就是要特意提高特征权重。比如想让普通人出现正常皱纹来体现年龄感,简单描述中年男/女性是不够的,需要用形容词或语法来提高权重才行,比如 “awful middle aged man or woman”(如下图)
- 使用“女性”或“模特”时,平均值保持不变,估计AI默认模特的性别就是女性。
- 图像的场景似乎对人的特征有很大影响,估计提示词中黑色的背景对人物某些特征的颜色有所影响。在这个实验之前,本来预计金发女郎会比黑发女郎多。

中年女性的正常皱纹效果
二、/ 男性特征实验 /
另外我们还发现,用“英俊”代替“美丽”会产生男性而不是女性。虽然这个测试样本数量不多,但是给人的第一印象是男性的多样性更糟,几乎每个男性的脸部特征都是西方典型的雕塑般面孔,棱角分明,卷卷的短发,且都有胡子,虽然感觉都很帅,但好像都是一个人,看多了真的脸盲了… …🧐

三、/ 其他因素实验 /
让我们回到最初的提示词会发现,其中加入了 “Shot on Sony Alpha a7 III Camera With a Sony FE 24-105mm f/4 G OSS Lens” 这一段关于相机镜头的描述,那么这些描述会不会也影响着人像的特征呢。答案是会的,因为在Midjourney的版本中,V5版本中对相机的描述其实对图像风格不会有太大的影响,但是在V5.1版本中,官方特意加强了对人像图片的优化,其中就包括提升提示词的匹配度。所以当我们去掉关于相机镜头和背景的描述再重新跑一次图片时,我们会发现出来的“美女”图片风格都出现了不小的差异性,包括发型、发色和图片色调等。

/ 总结 /
其实大家也发现了,现阶段对于AI来说, 提示词的丰富程度和图片的多样性其实是成反比关系,提示词描述的越少图片出来的效果就越多样,描述的越多图片就越接近描述的效果。这大概率是与AI绘画所训练的模型数据集规模有关,当数据集不够大到能覆盖现实生活中的方方面面时,它对现实的还原就是片面且局限的,这也是为什么它对“美”的理解会限定在那几种明显的特征上,这也说明Midjourney的模型中人像训练大多以欧美为主。还是希望Midjourney在后续的模型版本迭代中能增加亚洲人的训练权重,毕竟,谈论美学,怎么能忽视东方美的存在!

本文思路来源于推主@iamneubert
欢迎免费使用GPT对话,感受ChatGPT的魅力!AI爱好者 – 最具实力的中文AI交流社区平台 (aiahz.com)
长按扫描二维码进群领资源
