DeepSeek 是一款由深度求索(DeepSeek)开发的大语言模型,目前主要以文本形式进行交互。截至 2025 年,DeepSeek 官方版本本身并不直接具备语音合成(TTS)或语音识别(ASR)功能,也就是说它不能“说话”或“听声音”。
不过,用户可以通过将 DeepSeek 与第三方语音工具结合使用,实现语音输入或语音输出的效果。例如:
- 使用浏览器或操作系统的语音输入功能,将语音转为文字后发送给 DeepSeek;
- 将 DeepSeek 返回的文本结果通过 TTS 工具(如 Edge 朗读、Google 文字转语音等)转换为语音播放。
因此,虽然 DeepSeek 本体不支持语音,但在实际应用中,通过集成其他技术,完全可以实现“会说话的 DeepSeek”体验。
未来随着多模态能力的发展,官方可能会推出支持语音交互的 DeepSeek 版本,敬请关注官方更新。