实测DeepSeek“识图模式”:两次上传梁文锋照片,都识别成张一鸣
创始人
2026-06-20 19:31:31

红星资本局6月19日消息,6月18日,DeepSeek网页及APP端,均新增了“识图模式”,并显示“图片理解功能内测中”。同一天,DeepSeek多模态团队负责人陈小康在社交媒体上发文称,视觉模式已在网页和应用上正式上线,“试试这双新眼睛”。

6月19日,红星资本局实测发现,DeepSeek的识图功能并不太稳定。

红星资本局实测时上传了一张DeepSeek创始人梁文锋的照片,但DeepSeek将其识别为字节跳动的张一鸣;紧接着再上传另外一张梁文锋的照片,DeepSeek仍然认为是张一鸣;最后上传了张一鸣的照片,DeepSeek识别正确。

随后红星资本局开启新对话,重新上传张一鸣的照片,DeepSeek将其识别为寒武纪创始人陈天石;紧接着上传梁文锋的照片,DeepSeek仍然认为照片中的人是陈天石。在多次对话中,DeepSeek还曾表示“无法回答问题”。

DeepSeek在回答中表示,目前的“识图功能”其实是“读图”。

DeepSeek目前支持的图像文件上传和视觉识别为OCR模型,即读取图像中的文本,擅长从上传的图像(PDF、Word、Excel、PPT、JPG等)中读取文本,并处理该文本;而不是多模态视觉语言模型(VLM),无法以像素级别“看到”物体、人脸或场景。

对于将梁文锋识别成其他人,DeepSeek再次表示自己没有人脸识别模块,不会“看脸”只会“看字”,如果照片中只有一张脸,“我只能回复你图片中没有文字内容”。

于是红星资本局又上传了其他带有文字的图片,对于“货拉拉被约谈”的新闻资讯的封面,DeepSeek基本可以识别出图中内容,但将图中的“货拉拉”识别为“货拉业”,并认为是图片中的字打错了。对于“新东方集团总结大会”视频截图,DeepSeek可识别出图中的信息,并且精确捕捉到俞敏洪也在图片中。

对于纯文本类的图片,红星资本局选择了怀素的草书作品,DeepSeek可以识别部分文字,但将图中的“玉露凋伤枫树林”,识别为“王右丞诗枫桥”。对于Yum! Brands宣布出售必胜客业务的英文公告截图,DeepSeek可正确识别并翻译。

红星资本局又以相同的图片向豆包、千问、文心一言提问,均能正常识别,并没有出现DeepSeek的错误。文心一言甚至指出“王右丞诗枫桥”可能存在混淆。

5天前,陈小康曾将鹅腿阿姨的“绿色鸭腿”发给DeepSeek识别,从回复来看,DeepSeek能辨认出其不是鹅腿,同时表示可能存在食品安全隐患;但DeepSeek也没有识别出鸭腿,而是将其认作“烤鹌鹑”。

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司打造的大模型和AI助手,其主体运营公司成立于2023年,该产品于2025年年初火爆出圈,一度登顶应用商店排行榜榜首。

近日,DeepSeek首轮融资方案被曝光。其创始人梁文锋个人出资约200亿元;腾讯出资约100亿元;宁德时代体系出资约50亿元;网易、京东、Monolith砺思资本、IDG资本分别出资约30亿元;正心谷投资、拾象科技分别出资约15亿元。

目前,多模态已成为大模型产品的标配,并在视频生成领域不断扩展。

相关内容

热门资讯

原创 让... AG超玩会在挑杯一诺回归之后,虽然成绩比起春季赛确实进步了,但总决赛却在3-1领先的情况下,被狼队连...
布米普特拉北京投资基金管理有限... 随着人工智能能力日益精进,职场人的焦虑感也在同步攀升。然而,亚马逊创始人杰夫·贝索斯给出了一个截然相...
两款AI智能体在临床决策中的表... 两款基于大语言模型的AI智能体在虚拟测试中展示出媲美乃至超越医生的临床决策能力,但研究人员表示,目前...
布局前沿未来产业 深耕脑科学健... 2026 年 6 月18日,依托安徽大力发展脑机接口未来产业的政策东风,深耕 AI 智能康养多年的安...
原创 1... 答应大家的618热销榜机型介绍,我已经连续更新了多期,反响还挺好,之前很多消费者虽然很想在618期间...