DeepSeek(深度求索)是由中国公司深度求索(DeepSeek)开发的一系列大语言模型。其首次引起广泛关注是在2024年初。
具体来说,2024年1月,DeepSeek发布了其首个开源大模型 DeepSeek-V1,并在多个技术评测中表现出色,迅速吸引了开发者社区和AI研究者的注意。随后在2024年4月,DeepSeek 推出了更强的 DeepSeek-Coder 系列,专为代码生成优化,在 GitHub 上获得大量星标,进一步推动了其热度。
到了2024年中,随着国产大模型竞争加剧,DeepSeek 凭借其开源策略、高性能表现以及对中文场景的良好支持,成为国内最受关注的大模型之一。尤其在技术圈、高校和初创企业中广受好评,被广泛用于研究、教学和产品集成。
因此,可以说 DeepSeek 的“爆火”始于 2024年第一季度,并在 2024年上半年持续升温,成为国产大模型的重要代表之一。