什么是 DeepSeek?
DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,支持多种编程任务和自然语言处理场景。其代码通常托管在 GitHub 上,供开发者免费下载和使用。
准备工作
- 操作系统:推荐使用 Linux 或 macOS;Windows 用户建议启用 WSL(Windows Subsystem for Linux)。
- Python 环境:确保已安装 Python 3.9 或更高版本。
- Git 工具:用于克隆 DeepSeek 的官方代码仓库。
- GPU(可选但推荐):如需本地推理,建议配备 NVIDIA 显卡并安装 CUDA 驱动。
打开并运行 DeepSeek 代码的步骤
- 访问 DeepSeek 官方 GitHub 仓库(例如:
https://github.com/deepseek-ai/DeepSeek)。 - 在终端中执行:
git clone https://github.com/deepseek-ai/DeepSeek.git - 进入项目目录:
cd DeepSeek - 安装依赖:
pip install -r requirements.txt - 根据 README 文档加载模型权重并运行示例脚本。
常见问题
Q:没有 GPU 能运行吗?
A:可以,但速度较慢,仅适合测试或小规模任务。
Q:需要登录 Hugging Face 吗?
A:部分模型权重托管在 Hugging Face,可能需要注册账号并接受协议后才能下载。