DeepSeek(深度求索)是由深度求索(DeepSeek)公司推出的一系列开源大语言模型,在中文社区和AI开发者中迅速获得广泛关注。其“火起来”的关键节点主要集中在2024年初至年中。
DeepSeek首次公开发布 DeepSeek-LLM 系列模型,包括 7B 和 67B 参数版本,并在 Hugging Face 开源,初步吸引技术社区关注。
DeepSeek-Coder 系列模型发布,专为代码生成优化,在 GitHub 和 AI 圈引发热议,成为热门开源项目之一。
DeepSeek-V2 发布,引入 MoE(Mixture of Experts)架构,在性能与效率之间取得良好平衡,被多家媒体和评测平台推荐。
随着国内对国产大模型关注度提升,DeepSeek 在知乎、B站、微信公众号等平台频繁被提及,用户实测视频和教程大量涌现,真正“出圈”。
DeepSeek 成为中文开源大模型代表之一,广泛应用于教育、编程辅助、企业私有化部署等领域,持续迭代并保持活跃社区支持。
综上所述,DeepSeek 的“火爆”并非一蹴而就,而是从2023年底开始积累,于2024年春季集中爆发,并在年中形成稳定影响力。