简介
本手册由清华大学人工智能研究团队编写,旨在为开发者、研究人员及企业用户提供 DeepSeek 系列大语言模型的完整使用指南。内容涵盖模型架构、部署方法、API 调用示例、微调策略及常见问题解答。
核心特性
DeepSeek 系列模型具备以下优势:
- 支持超长上下文(最高达 128K tokens)
- 多语言理解与生成能力
- 高效推理与低延迟响应
- 开源可商用,社区生态活跃
快速开始
访问 DeepSeek 官网 获取最新模型权重与 SDK。通过 pip 安装官方 Python 包即可开始调用:
pip install deepseek-sdk