打造中国最大的
AI交流社区平台

探索AI眼中的“美”

探索AI眼中的“美”插图
探索AI眼中的“美”插图1

图源:推主@iamneubert

最近网上冲浪的时候发现了一个关于AI绘画如何诠释“美”这一概念的讨论,该讨论通过主流的AI绘画软件“Midjourney”进行实验,通过输入描述“美”的提示词,再对输出的图片进行统计和分析。最终的结论是,我们理解的“美”可能超出了AI当前的理解范围

探索AI眼中的“美”插图2

图源:群友“按时吃早饭”

我们常常会有这样的感觉:相比起用相机拍摄的照片,AI生成的图像总是显得不够真实,不论是真人特写还是其他类型的图像。细究其原因,我们会发现这是因为AI在创作图像时,倾向于创造完美的画面。例如,在没有特殊描述的情况下,AI生成的人像往往会有光滑的皮肤,没有皱纹,五官和脸型都会非常规整。然而,真实世界中没有完美的人,也正是这些“不完美”的部分让我们觉得人是真实、有深度的。

探索AI眼中的“美”插图3

图源:群友“鼘”

所以今天通过几个简单实验,来探索一下AI眼中的“美”究竟是什么样子的:👇

一、/ 女性特征实验 /

本次实验中,首先选择标准的人像图片来观察AI的输出结果。在Midjourney选择最新的v5.1模型,并使用一个通用的提示词描述,不特意强调人物的肤色、头发颜色这些特征,咒语如下:

Editorial Portrait, Beautiful Woman, Photoshoot Lighting, Detailed Face, Black Background, Shot on Sony Alpha a7 III Camera With a Sony FE 24-105mm f/4 G OSS Lens –style raw专题肖像、美丽女人、拍摄灯光、精细面部、黑色背景、使用索尼Alpha a7 III相机和索尼FE 24-105mm f / 4 G OSS镜头拍摄——raw 样式。

这是一次比较简单且不够严谨的实验,但从此次的结果中,我们也可以从中分析Midjourney中关于女性的一些特征权重,下面是实验结果:

探索AI眼中的“美”插图4

通过相同的提示词生成了 264 张人物肖像后,我们发现Midjourney 似乎对浅色眼睛的黑发女郎有强烈的偏好,或许这就是它认为的美女😂,详细数据如下:

  • 头发特征黑发:75% (197);金发:23% (61);红头发:2% (6);其他:0%
探索AI眼中的“美”插图5
  • 眼睛颜色

浅色眼睛:68% (180);黑眼睛:32% (84)

探索AI眼中的“美”插图6
  • 肤色人种

白色人种86% (227);黄色人种11% (29);黑色人种3% (8)

探索AI眼中的“美”插图7
  • 人物年龄

年轻人:100%;中年人:0%

  • 其他特征:皱纹:0%;疤痕:0%;眼镜:0%

进一步分析我们还发现:

  • Midjourney 的多样性非常差,比预期的更极端,人像的特征经常会出现重复的现象。
  • 似乎对于某些人像特征,需要提供更多的描述才能增加它出现在图片中的可能性,也就是要特意提高特征权重。比如想让普通人出现正常皱纹来体现年龄感,简单描述中年男/女性是不够的,需要用形容词或语法来提高权重才行,比如 “awful  middle aged man or woman”(如下图)
  • 使用“女性”或“模特”时,平均值保持不变,估计AI默认模特的性别就是女性
  • 图像的场景似乎对人的特征有很大影响,估计提示词中黑色的背景对人物某些特征的颜色有所影响。在这个实验之前,本来预计金发女郎会比黑发女郎多。
探索AI眼中的“美”插图8

中年女性的正常皱纹效果

二、/ 男性特征实验 /

另外我们还发现,用“英俊”代替“美丽”会产生男性而不是女性。虽然这个测试样本数量不多,但是给人的第一印象是男性的多样性更糟,几乎每个男性的脸部特征都是西方典型的雕塑般面孔,棱角分明,卷卷的短发,且都有胡子,虽然感觉都很帅,但好像都是一个人,看多了真的脸盲了… …🧐

探索AI眼中的“美”插图9

三、/ 其他因素实验 /

让我们回到最初的提示词会发现,其中加入了 “Shot on Sony Alpha a7 III Camera With a Sony FE 24-105mm f/4 G OSS Lens” 这一段关于相机镜头的描述,那么这些描述会不会也影响着人像的特征呢。答案是会的,因为在Midjourney的版本中,V5版本中对相机的描述其实对图像风格不会有太大的影响,但是在V5.1版本中,官方特意加强了对人像图片的优化,其中就包括提升提示词的匹配度。所以当我们去掉关于相机镜头和背景的描述再重新跑一次图片时,我们会发现出来的“美女”图片风格都出现了不小的差异性,包括发型、发色和图片色调等。

探索AI眼中的“美”插图10

/ 总结 /

其实大家也发现了,现阶段对于AI来说, 提示词的丰富程度和图片的多样性其实是成反比关系,提示词描述的越少图片出来的效果就越多样,描述的越多图片就越接近描述的效果。这大概率是与AI绘画所训练的模型数据集规模有关,当数据集不够大到能覆盖现实生活中的方方面面时,它对现实的还原就是片面且局限的,这也是为什么它对“美”的理解会限定在那几种明显的特征上,这也说明Midjourney的模型中人像训练大多以欧美为主。还是希望Midjourney在后续的模型版本迭代中能增加亚洲人的训练权重,毕竟,谈论美学,怎么能忽视东方美的存在!

探索AI眼中的“美”插图11

本文思路来源于推主@iamneubert

欢迎免费使用GPT对话,感受ChatGPT的魅力!AI爱好者 – 最具实力的中文AI交流社区平台 (aiahz.com)

长按扫描二维码进群领资源

探索AI眼中的“美”插图12
赞(0) 打赏
未经允许不得转载:AI爱好者 » 探索AI眼中的“美”

评论 抢沙发

欢迎来到AI爱好者

我们旨在打造一个最具实力的中文AI交流社区平台,致力于为所有AI爱好者,创业者和使用者提供优质服务. 我们的宗旨是为广大用户提供免费解决方案,您可以通过问答形式提出与AI相关的任何问题.

AI社区AI工具

安全服务战略合作伙伴:麒麟盾 SCDN

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫打赏

登录

找回密码

注册