DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,在中文社区和开发者圈中引起了广泛关注。
根据公开资料和社区讨论,DeepSeek真正开始“火”起来是在2024年初。尤其是2024年2月至3月期间,随着 DeepSeek-V2 和 DeepSeek-Coder 等版本的陆续发布,其在代码生成、数学推理和多语言支持方面的卓越表现,迅速吸引了大量技术用户和企业的关注。
DeepSeek 的爆红主要得益于以下几个因素:
- 开源策略:模型权重完全开源,允许研究者和开发者自由使用与微调。
- 性能优异:在多个权威基准测试中表现突出,尤其在代码理解和生成任务上接近甚至超越部分闭源模型。
- 本地部署友好:提供多种参数规模版本(如 1.3B、7B、67B),适配不同硬件环境。
- 社区活跃:GitHub 上 star 数快速增长,Hugging Face 模型下载量激增,技术博客和视频教程大量涌现。
因此,虽然 DeepSeek 项目早在2023年就已启动,但其真正进入大众视野并形成“现象级热度”,是在2024年第一季度。