DeepSeek 是由深度求索(DeepSeek)推出的一系列大语言模型,部分版本支持多模态能力,包括图像识别(识图)功能。本文将为您介绍 DeepSeek 如何实现识图、使用方法及相关注意事项。
什么是 DeepSeek 识图?
DeepSeek 识图是指模型能够理解用户上传的图片内容,并基于图像信息进行回答。例如:识别图片中的文字、物体、场景,或对图表进行解读等。
如何使用 DeepSeek 识图功能?
- 访问 DeepSeek 官方网站或支持识图的平台(如 DeepSeek 官方 App 或网页版)。
- 在聊天输入框附近找到“上传图片”按钮。
- 选择一张本地图片(支持 JPG、PNG 等常见格式)。
- 输入您的问题,例如“这张图里写了什么?”或“请解释这张图表。”
- 发送后,DeepSeek 将结合图像内容给出回答。
支持的图片类型
- 截图(含文字、表格、代码等)
- 照片(物品、场景、人物等)
- 图表(柱状图、折线图、饼图等)
- 手写内容(清晰可辨时效果更佳)
常见问题
Q:所有 DeepSeek 模型都支持识图吗?
A:目前仅 DeepSeek-VL 等多模态版本支持识图功能,标准文本模型(如 DeepSeek-7B/67B)不支持。
Q:识图功能是否免费?
A:部分平台提供免费额度,超出后可能需要订阅高级服务,具体以官方说明为准。
Q:上传的图片会被保存吗?
A:建议查看平台隐私政策。通常情况下,图片仅用于本次对话,不会长期存储。