截至当前(2025年),DeepSeek 官方发布的开源大语言模型(如 DeepSeek-VL 系列除外)主要专注于文本处理任务,标准版本的 DeepSeek(例如 deepseek-coder、deepseek-llm)。
DeepSeek 团队已推出多模态大模型 DeepSeek-VL,该版本能够理解图像内容,并结合文本进行推理。这意味着如果你使用的是 DeepSeek-VL 系列模型,则可以实现基础的图片识别、图文问答等功能。
但请注意:普通用户通过公开渠道(如网页版或标准 API)访问的 DeepSeek 服务,通常默认为纯文本模型,可能未启用图像识别功能。
如果你需要将图片中的文字提取出来再交给 DeepSeek 处理,可先使用 OCR 工具(如百度 OCR、腾讯 OCR 或免费在线工具)将图片转为文本,再粘贴到 DeepSeek 中进行分析。