
GPT-4强大到什么程度,这有一个典型的案例
这个人用笔在本子上随便画了个自己网站的草图

然后用手机把这个草图拍下来

发送给GPT-4

它识别出了这是一个网站的草图

然后顺便生成了要建成这个网页的代码

好了,你的网站建好了

相比之下,这是原始的图

它强就强在可以接受图片为输入,并且能准确理解图片中的含义。
视觉输入性能
简短版:还在研究阶段,不公开。
详细版:GPT-4可以接受文本和图像输入,并且这两个是可以掺杂着用,它允许你用跟之前文本一样的使用方式。
一共有7个例子,总结起来,它可以识别搞笑图片,可以做复杂的物理化学之类的题目,可以做看图题,可以读论文,可以识别meme图片,总之,非常的强,可惜还不能开放使用。
第一个图
可以看到,它非常准确的认出了每幅图,并能理解为什么这幅图的搞笑之处。

第二幅图
这是一个对于普通人非常简单的看图题,但是对于之前的机器学习,这是很难做到的,GPT-4不仅可以读懂问题,还能非常完整的回答对。

第三幅图
这已经是一道有点儿复杂的像是物理的问题了,回答的准确无误。

第四幅图:
还是找异常点,准确。

第五幅图
读论文并总结,好像ChatPDF要完蛋了。

第六幅图
我也是想了几秒钟后才察觉这是一个由鸡块构成的地球,GPT-4的回答非常精准。

第七幅图
解释了统计机器学习和深度学习的异同点,前者取消降低过拟合,
后者需要增大网络层数,其实是一个比较专业性的搞笑图片。
但是结论是完全没问题的。

视觉数据集上的表现
还是没有经过微调,部分超过SOTA,部分跟SOTA持平,总之,很强。

下面是GPT-4的最新最全解释:
GPT-4多模态模型最新最全介绍-下一代语言模型的力量与潜力 – 知乎 (zhihu.com)
欢迎免费使用GPT对话,感受ChatGPT的魅力!AI爱好者 – 最具实力的中文AI交流社区平台 (aiahz.com)
长按扫描二维码进群领资源

5.0会怎么样,真不敢想