ChatGPT大升级!一键制图+识图,强大无比!

最近,ChatGPT大招频频,不仅开放了语音功能,使得气泡音质感秒杀市面上的所有AI配音工具,还开放了DALL E3功能,直接向Midjourney发起猛烈冲击,甚至某些功能超越了Midjourney。现在,ChatGPT又向PLUS用户开放了图像识别功能,这一系列操作无疑是对其他AI大模型进行了降维式打击。 经过半个月的等待,小编来为大家进行一次测评,让大家直观感受ChatGPT的新功能。考虑到文章的形式,将重点放在了DALL E3的绘图功能和GPT-4的图像识别功能上。 首先,让我们来看看DALL E3的绘图功能。

试了几张图片,结果显示画出的效果非常好,不仅精准度极高,而且富有想象力,充满了艺术感。这与市面上其他的绘图工具相比,简直是天壤之别。ChatGPT此次开放的这个功能,无疑又提升了AA大模型在艺术领域的竞争力。 接着是GPT-4的图像识别功能。这个功能的体验也非常让人满意。这个功能可以将一张图片转化为文字或者音频,识别准确率高且速度快。这不仅提升了用户的使用体验,也为ChatGPT大模型在其他领域的广泛应用打开了新的可能性。

DALL E31)图片质量我同时使用DALL E3和Midjourney进行绘画,用同一套提示词进行测试,分别看一下这两个工具的表现如何:首先是一组简单的提示词:a girl

DALL E3的成果:

图片[1]-ChatGPT大升级!一键制图+识图,强大无比!

DALL E3给出了4组不同画风的图片,质量嘛……说实话,不敢恭维。那再来看一看Midjourney的表现什么样:

图片[2]-ChatGPT大升级!一键制图+识图,强大无比!

很明显,Midjourney做的图,无论是从氛围还是质感上都要比DALL E3高出几个档次。当然,这只能说明在简单提示词下Midjourney表现更好。那如果换成一套复杂的提示词,双方表现又会怎么样呢?于是我又找了一组比较复杂的提示词进行了测试:

Lionel Messi displaying his dynamic, precision, intensity, speed, and finesse. High-speed sports camera. Telephoto lens. Late afternoon. Dramatic style of photograph. Kodak Portra 400 filmDALL E3:

图片[3]-ChatGPT大升级!一键制图+识图,强大无比!

Midjourney:

图片[4]-ChatGPT大升级!一键制图+识图,强大无比!

照片质量方面,虽然两者之间的差距并不大,但Midjourney在光线运用的技巧上显然更加成熟。然而,如果深入探讨画面内容,Midjourney的表现则明显优于DALL E3。在要求画出梅西的例子中,DALL E3未能成功理解并绘制出符合要求的图片,这可能与它缺乏名人照片的训练数据有关。 DALL E3被官方描述为具有更强的文字理解能力,能够制作出更符合文字信息的图片。然而,在测试中,我发现DALL E3在处理不同语言的提示词时表现出色,能够根据语种绘制出不同风格的图片。这表明它在文字处理方面具有足够的智能。

图片[5]-ChatGPT大升级!一键制图+识图,强大无比!

可以看出来,同样的描述词,使用英语、汉语和日语做出来的图片都各有各的风格。另外DALL E3对于描述词的识别准确率也要更高,比如:“一张桌子,桌子左边放着一个红色杯子,右边放着一个绿色杯子”DALL E3做出来的图效果是这样的:

图片[6]-ChatGPT大升级!一键制图+识图,强大无比!

除了左下角的图片不太准确,其他图片都能够很准确地画出描述的场景。虽然质量有些参差,但基本上都能满足我的要求。而Midjourney画出来的效果是这样:

图片[7]-ChatGPT大升级!一键制图+识图,强大无比!

很明显,Midjourney对于画面语言的识别准确率还不够高,四张图没有一张符合要求的。所以在图片细节的识别准确度上,可以说DALL E3完胜Midjourney。3)文字生成网络上对于DALL E3的文字生成能力普遍是好评如潮,但是经过我的测试发现,它的文字生成能力还远远不够精确。

图片[8]-ChatGPT大升级!一键制图+识图,强大无比!

当然,肯定还是要比Midjourney强不少的,但是要想达到商用的程度还有段距离。不过这个功能也确实给了我们更多的期待,给AI绘画增添了很多的可能性。图像识别功能这个功能可以说是直接对其他AI大模型降维式打击。无论是从实用性和操作性上来讲,都绝对是AI的一次进化。上传一张图片,它能够直接识别出照片的内容:

图片[9]-ChatGPT大升级!一键制图+识图,强大无比!

不仅是食物,你随便上传一张风景图,它也可以给你识别出这是哪里,但是一些特色不太明显的地方它就只能给出一个大致的区域。当然,这还只是最基本的操作,它还可以看出一张图片背后隐含的信息,比如:

图片[10]-ChatGPT大升级!一键制图+识图,强大无比!

它甚至可以直接识别出动物或者人物的表情,这个是让我最惊奇的,就好像AI拥有了眼睛和思想一样。
网上有很多人甚至使用这个功能来看手相:

图片[11]-ChatGPT大升级!一键制图+识图,强大无比!

看片子:

图片[12]-ChatGPT大升级!一键制图+识图,强大无比!

准不准先另说,但起码实用是真的实用!当然,要说最让我觉得牛逼的地方,还是它能够识别出图片后一键做一个网页出来。比如我想把下面这个页面做成网页:

图片[13]-ChatGPT大升级!一键制图+识图,强大无比!

直接把网页上传到ChatGPT,然后把需求告诉它:

图片[14]-ChatGPT大升级!一键制图+识图,强大无比!

一个简易版的网页就搞定了:

图片[15]-ChatGPT大升级!一键制图+识图,强大无比!

图像识别这个功能和GPT4结合到一起,就像是给一部超级大脑装上了一副眼睛,绝对是AI里的一套王炸组合!这个功能还能够实现的场景和操作有很多,篇幅原因,今天就不细讲了。可以持续关注本站,为您带来更多资讯!

THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容