首页 技术教程 正文阅读

DeepSeek大更新!终于「开眼」了

emer 2026-04-29
2 0

原以为这个疯狂的 AI 疯狂更新应该已经告一段落了,没想到上周才发完 V4 的 DeepSeek ,突然端出一个更大的惊喜。
DeepSeek大更新!终于「开眼」了 - 第 1 张图
就在刚刚, DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了!

DeepSeek大更新!终于「开眼」了 - 第 2 张图
目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式。

DeepSeek 负责多模态的研究员陈小康在 X 上发文: Now, we see you,并配上了一张图,我们就让 DeepSeek 来解读一下这张图何意味。

DeepSeek大更新!终于「开眼」了 - 第 3 张图
结果显示,它能识别出这张图背后的隐喻,虽然图中没有任何关于DeepSeek 的字眼,但它结合对发布者身份和图像的识别,推断出这是关于 DeepSeek 多模态能力的更新。

最后给出一句十分到位的总结:那个看不见世界的鲸鱼,现在终于睁开眼了。

DeepSeek大更新!终于「开眼」了 - 第 4 张图
我发现 DeepSeek 识图模式的思考过程更有意思。

DeepSeek大更新!终于「开眼」了 - 第 5 张图
这才是我们刷到一张梗图时脑子里真正发生的事。没人会先数鲸鱼有几只,我们关心的是谁在对谁说话,说的是什么潜台词。

而且它还会来来回回的自我纠正。

比如它甚至一度把图中的眼罩联想到《天元突破》里卡米那的眼镜,然后自己打脸: 「不,这太宅男向了。」「等等,仔细看……」 「再换个角度……」 。

前面那些推理、联想、自我纠正,都挺精彩。但整段思考过程里最反常识的部分,其实是它推理到快收尾时,突然自己喊了个暂停,给自己开了一场小型答辩会。

DeepSeek大更新!终于「开眼」了 - 第 6 张图
它列出三个问题自问自答,先确认客观事实,再推测事件性质,最后才做解读。 DeepSeek 把这个我们自己都没意识到的思维习惯,做成了识图的思考逻辑。

就像我们平时给结论之前,脑子里也会过一遍:「等等,这个前提对吗?那个假设站得住吗?万一我理解错了方向呢?」

我们还把经典的 AI 测试题——数手指,抛给了 DeepSeek。

DeepSeek大更新!终于「开眼」了 - 第 7 张图
它思考了一通,还是回答错了,中间还吐槽了一句:「我真的是数晕了。」
不过如果我再引导一下,它还是可以回答正确。

DeepSeek大更新!终于「开眼」了 - 第 8 张图
另外一个数手指的测试中,第一次回答错误之后,我没给答案,只是让它再想想,也能给出正确的回答。

DeepSeek大更新!终于「开眼」了 - 第 9 张图

DeepSeek 识图的准确率其实还是比较高,不开思考模式的话甚至半秒就能给出回答。

emer

emer

每天发现网络新鲜事

61746 文章
13 分类
8643.8k+ 访问

搜索

Zoomed Image