截至当前(2025年),DeepSeek 官方版本(包括 DeepSeek-Coder、DeepSeek-VL 等)并不直接支持用户上传音频文件进行处理。DeepSeek 主要专注于文本生成、代码理解和多模态图文任务,尚未集成语音识别(ASR)或音频分析功能。
如果您希望将音频内容输入给 DeepSeek,建议先使用第三方工具将音频转换为文字,例如:
- 讯飞听见、百度语音、腾讯云语音识别等专业 ASR 服务
- Whisper 开源模型(本地或在线部署)
- 手机自带的语音转文字功能
获得文字后,即可将转写内容粘贴至 DeepSeek 的输入框中,由其进行总结、翻译、问答或其他智能处理。
未来 DeepSeek 若推出支持音频输入的多模态版本,可能会开放相关接口。建议关注其官网或 GitHub 项目更新。