DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,在中文社区和开发者圈中迅速走红。
虽然 DeepSeek 公司早在 2023 年就已成立并开始研发大模型,但真正引起广泛关注是在 2024 年初。特别是 2024 年 1 月,DeepSeek 正式开源了其第一代大模型 DeepSeek-V1,并在 Hugging Face 和 GitHub 上发布了相关代码和权重,迅速吸引了大量 AI 爱好者、研究人员和开发者的关注。
随后在 2024 年 4 月,DeepSeek 推出了性能更强的 DeepSeek-Coder 系列模型,专为代码生成优化,在多个权威代码评测榜单上表现优异,进一步推动了其热度。与此同时,社区中关于 DeepSeek 的教程、部署指南、微调案例等内容大量涌现,使其成为国产开源大模型中的“顶流”之一。
到了 2024 年下半年,随着 DeepSeek-V2 和 DeepSeek-MoE 等更高效、更轻量的模型陆续发布,DeepSeek 不仅在技术圈持续升温,也开始被更多企业和个人用户实际应用,真正实现了“出圈”。
综上所述,DeepSeek 的爆红始于 2024 年 1 月的首次开源,并在随后几个月凭借持续的技术迭代和活跃的社区生态迅速走红。