ChatGPT大升级！一键制图+识图，强大无比！

最近，ChatGPT大招频频，不仅开放了语音功能，使得气泡音质感秒杀市面上的所有AI配音工具，还开放了DALL E3功能，直接向Midjourney发起猛烈冲击，甚至某些功能超越了Midjourney。现在，ChatGPT又向PLUS用户开放了图像识别功能，这一系列操作无疑是对其他AI大模型进行了降维式打击。经过半个月的等待，小编来为大家进行一次测评，让大家直观感受ChatGPT的新功能。考虑到文章的形式，将重点放在了DALL E3的绘图功能和GPT-4的图像识别功能上。首先，让我们来看看DALL E3的绘图功能。

试了几张图片，结果显示画出的效果非常好，不仅精准度极高，而且富有想象力，充满了艺术感。这与市面上其他的绘图工具相比，简直是天壤之别。ChatGPT此次开放的这个功能，无疑又提升了AA大模型在艺术领域的竞争力。接着是GPT-4的图像识别功能。这个功能的体验也非常让人满意。这个功能可以将一张图片转化为文字或者音频，识别准确率高且速度快。这不仅提升了用户的使用体验，也为ChatGPT大模型在其他领域的广泛应用打开了新的可能性。

DALL E31）图片质量我同时使用DALL E3和Midjourney进行绘画，用同一套提示词进行测试，分别看一下这两个工具的表现如何：首先是一组简单的提示词：a girl

DALL E3的成果：

DALL E3给出了4组不同画风的图片，质量嘛……说实话，不敢恭维。那再来看一看Midjourney的表现什么样：

很明显，Midjourney做的图，无论是从氛围还是质感上都要比DALL E3高出几个档次。当然，这只能说明在简单提示词下Midjourney表现更好。那如果换成一套复杂的提示词，双方表现又会怎么样呢？于是我又找了一组比较复杂的提示词进行了测试：

Lionel Messi displaying his dynamic, precision, intensity, speed, and finesse. High-speed sports camera. Telephoto lens. Late afternoon. Dramatic style of photograph. Kodak Portra 400 filmDALL E3：

Midjourney:

照片质量方面，虽然两者之间的差距并不大，但Midjourney在光线运用的技巧上显然更加成熟。然而，如果深入探讨画面内容，Midjourney的表现则明显优于DALL E3。在要求画出梅西的例子中，DALL E3未能成功理解并绘制出符合要求的图片，这可能与它缺乏名人照片的训练数据有关。 DALL E3被官方描述为具有更强的文字理解能力，能够制作出更符合文字信息的图片。然而，在测试中，我发现DALL E3在处理不同语言的提示词时表现出色，能够根据语种绘制出不同风格的图片。这表明它在文字处理方面具有足够的智能。

可以看出来，同样的描述词，使用英语、汉语和日语做出来的图片都各有各的风格。另外DALL E3对于描述词的识别准确率也要更高，比如：“一张桌子，桌子左边放着一个红色杯子，右边放着一个绿色杯子”DALL E3做出来的图效果是这样的：

除了左下角的图片不太准确，其他图片都能够很准确地画出描述的场景。虽然质量有些参差，但基本上都能满足我的要求。而Midjourney画出来的效果是这样：

很明显，Midjourney对于画面语言的识别准确率还不够高，四张图没有一张符合要求的。所以在图片细节的识别准确度上，可以说DALL E3完胜Midjourney。3）文字生成网络上对于DALL E3的文字生成能力普遍是好评如潮，但是经过我的测试发现，它的文字生成能力还远远不够精确。

当然，肯定还是要比Midjourney强不少的，但是要想达到商用的程度还有段距离。不过这个功能也确实给了我们更多的期待，给AI绘画增添了很多的可能性。图像识别功能这个功能可以说是直接对其他AI大模型降维式打击。无论是从实用性和操作性上来讲，都绝对是AI的一次进化。上传一张图片，它能够直接识别出照片的内容：

不仅是食物，你随便上传一张风景图，它也可以给你识别出这是哪里，但是一些特色不太明显的地方它就只能给出一个大致的区域。当然，这还只是最基本的操作，它还可以看出一张图片背后隐含的信息，比如：

它甚至可以直接识别出动物或者人物的表情，这个是让我最惊奇的，就好像AI拥有了眼睛和思想一样。
网上有很多人甚至使用这个功能来看手相：

看片子：

准不准先另说，但起码实用是真的实用！当然，要说最让我觉得牛逼的地方，还是它能够识别出图片后一键做一个网页出来。比如我想把下面这个页面做成网页：

直接把网页上传到ChatGPT，然后把需求告诉它：

一个简易版的网页就搞定了：

图像识别这个功能和GPT4结合到一起，就像是给一部超级大脑装上了一副眼睛，绝对是AI里的一套王炸组合！这个功能还能够实现的场景和操作有很多，篇幅原因，今天就不细讲了。可以持续关注本站，为您带来更多资讯！

THE END