什么是 DeepSeek AI?(功能、OpenAI 比较等)

DeepSeek 成立于 2023 年,开始研究和开发新的 AI 工具——特别是开源大型语言模型。

不到两年的时间,该公司已迅速成为该领域的知名企业。他们的 AI 模型可与 OpenAI 和 Google 等行业领导者相媲美,但成本却仅为后者的一小部分。

在首款免费聊天机器人应用程序发布后的两周内,该移动应用程序就飙升至美国应用商店排行榜的榜首。

该公司最新的人工智能模型还引发了全球科技股抛售,导致 Nvidia、Oracle 和 Meta 等公司的市值蒸发近 1 万亿美元。

考虑到这种影响,以下是您将在本文中了解到的有关 DeepSeek 的所有内容的细分:

  • 什么是 DeepSeek?
  • 有多少人使用 DeepSeek?
  • DeepSeek 的初始发展
  • DeepSeek 模型和发布历史
  • DeepSeek 与 OpenAI:基准测试与性能
  • DeepSeek-R1 定价和成本
  • 如何访问DeepSeek
  • DeepSeek 比 ChatGPT 更好吗?

什么是 DeepSeek?

DeepSeek 是一家中国人工智能初创公司,隶属于总部位于中国杭州的量化对冲基金 High-Flyer。

梁文锋是DeepSeek创始人兼CEO,2016年联合创办High-Flyer,后来成为DeepSeek的唯一支持者。

该公司开发了一系列开源模型,可与世界上一些最先进的人工智能系统相媲美,包括 OpenAI 的 ChatGPT、Anthropic 的 Claude 和谷歌的 Gemini。

然而,与许多美国竞争对手不同,DeepSeek 是开源的并且可以免费使用。

它还引起了主流媒体的关注,美国华侨华人数据 因为它声称训练成本不到 600 万美元,而 OpenAI 的 GPT-4 则需 1 亿美元。

一些人将 DeepSeek 的发布称为美国人工智能领域的“斯普特尼克时刻” 。

科技界当然已经注意到了这一点。根据Exploding Topics 的数据,由于发布了最新的模型和聊天机器人应用程序,仅在过去三个月内,人们对这家中国人工智能公司的兴趣就增加了 99 倍。3 个月内,“DeepSeek AI” 的搜索量增加了 99 倍以上。

有多少人使用 DeepSeek?

根据最新数据,DeepSeek 支持超过1000 万用户。

自发布以来,该应用程序在 Google Play 商店中的下载量已超过1000 万次。

HuggingFace 报告称,DeepSeek 珍妮佛·艾尔森 项目管理员 模型在该平台上的下载量已超过 500 万次。其中包括 500 多个衍生 DeepSeek 模型的创建。

看看其他 AI 聊天机器人如何适应 DeepSeek 的开源发布和日益增长的受欢迎程度,以及这家中国初创公司能否继续以这种速度增长,将会很有趣。

Semrush报告称, 2024 年 11 月至 12 月期间, DeepSeek 的网站流量从每月 460 万次访问量增加到 1260 万次。

想要监视你的竞争对手吗?

探索竞争对手的网站流量统计数据,发现增长点并扩大您的市场份额。

DeepSeek 的初始发展

ChatGPT 发布后,仅用 5 天就迅速获得了 100 万用户。中国电话号码 到第 40 天,ChatGPT 的用户数量已达 1000 万。

2025 年 1 月推出的 DeepSeek 走上了一条略有不同的成功之路。它在 14 天内就达到了第一百万用户,比 ChatGPT 的时间几乎长三倍。

然而,DeepSeek 的增长速度随后急剧加快。该平台仅用 20 天就达到了 1000 万用户大关,而 ChatGPT 达到这一里程碑所用的时间仅为后者的一半。

以下是热门在线服务的比较,以及它们达到 100 万和 1000 万用户目标所需的时间:

在线服务 推出年份 达到 100 万用户所需的时间 达到 1000 万用户所需的时间
DeepSeek 2025 14天 20 天
ChatGPT 2022 5 天 40天
困惑人工智能 2022 2个月 13个月
Instagram 2010 2.5个月 355天
Facebook 2004 10个月 852天
线程 2023 1 小时 7 小时
叽叽喳喳 2006 2 年 780天
Netflix 1999 3.5 年 9 年

在用户数量达到 1000 万后不久,ChatGPT 于 2023 年 1 月(发布后约 60 天)达到 1 亿月活跃用户。DeepSeek

能否在接下来的几个月里继续以类似的速度增长,这将会很有趣。

DeepSeek 模型和发布历史

自公司成立以来,他们已经开发了许多 AI 模型。他们最新的模型 DeepSeek-R1 是开源的,被认为是最先进的。

以下是 DeepSeek AI 模型的发布历史:

模型 发布日期 参数 关键差异化因素 最适合
DeepSeek 编码器 2023 年 11 月 1B 至 33B 开源,87% 为代码,13% 为自然语言训练 编码任务、软件开发
DeepSeek 法学硕士 2023 年 12 月 67B 通用模型,性能接近 GPT-4 广泛的语言理解
DeepSeek-V2 2024 年 5 月 总计 236B,活跃 21B 多头潜在注意力 (MLA)、DeepSeekMoE 架构 高效推理,经济训练
DeepSeek-Coder-V2 2024 年 7 月 236B 128,000 个 token 上下文窗口,支持 338 种编程语言 复杂的编码挑战、数学推理
DeepSeek-V3 2024 年 12 月 总计 671B,活跃 37B 混合专家架构,FP8 混合精度训练 多领域语言理解,性价比高
DeepSeek-R1 2025 年 1 月 总计 671B,活跃 37B 纯强化学习方法,开源 高级推理、解决问题,与 OpenAI 的 o1 模型相媲美

DeepSeek Coder(2023 年 11 月)

DeepSeek Coder 是该公司首个专为编码任务而设计的 AI 模型。

它基于 87% 的代码和 13% 的自然语言进行训练,为研究和商业用途提供免费的开源访问。

DeepSeek 法学硕士(2023 年 12 月)

DeepSeek LLM 是该公司第一个通用大型语言模型。

它拥有 670 亿个参数,接近 GPT-4 级别的性能,并展示了 DeepSeek 在广泛语言理解领域与老牌人工智能巨头竞争的能力。

DeepSeek-V2(2024 年 5 月)

DeepSeek-V2 引入了创新的多头潜在注意力和 DeepSeekMoE 架构。

该模型共有 2360 亿个参数,其中活跃参数有 210 亿个,显著提高了推理效率和训练经济性。

DeepSeek-Coder-V2(2024 年 7 月)

DeepSeek-Coder-V2扩展了原始编码模型的功能。

它具有 2360 亿个参数、128,000 个标记上下文窗口,并支持 338 种编程语言,可以处理更复杂的编码任务。

DeepSeek-V3(2024 年 12 月)

DeepSeek-V3 标志着一个重要的里程碑,其总参数量达 6710 亿,其中活跃参数量达 370 亿。

该模型采用了先进的混合专家架构和FP8混合精度训练,在语言理解和性价比方面树立了新的标杆。

DeepSeek-R1(2025 年 1 月)

DeepSeek-R1是该公司的最新模型,专注于高级推理能力。

通过纯强化学习进行训练,它可以在复杂问题解决方面,特别是在数学推理方面与顶级模型相媲美。

DeepSeek 与 OpenAI:基准测试与性能

OpenAI 一直是人工智能竞赛中无可争议的领导者,但 DeepSeek 最近抢走了一些风头。

下面,我们重点介绍每个模型的性能基准,并展示它们在数学、编码和常识等关键类别中的比较情况。

DeepSeek-RI 和 OpenAI-o1 模型的性能基准。

数学基准

DeepSeek-R1在数学推理任务中表现出色。事实上,它在两个关键基准测试中都击败了 OpenAI。

在 AIME 2024 上,它的得分为 79.8%,略高于 OpenAI o1-1217 的 79.2%。该测试评估高级多步数学推理。

对于 MATH-500,DeepSeek-R1 以 97.3% 领先,而 OpenAI o1-1217 的得分为 96.4%。该测试涵盖了各种需要详细推理的高中数学问题。

编码基准

两种模型都表现出强大的编码能力。

在 Codeforces 上,OpenAI o1-1217 以 96.6% 领先,而 DeepSeek-R1 则达到 96.3%。该基准测试评估编码和算法推理能力。

对于 SWE-bench Verified,DeepSeek-R1 得分为 49.2%,略高于 OpenAI o1-1217 的 48.9%。该基准测试侧重于软件工程任务和验证。

常识基准

这些模型的一个显著区别是它们的常识优势。

在 GPQA Diamond 上,OpenAI o1-1217 以 75.7% 领先,而 DeepSeek-R1 得分为 71.5%。这衡量了模型回答通用知识问题的能力。

对于 MMLU,OpenAI o1-1217 略胜于 DeepSeek-R1,分别为 91.8% 和 90.8%。该基准测试评估多任务语言理解。

DeepSeek-R1 是 OpenAI 的有力竞争对手,尤其是在推理 AI 领域。虽然 OpenAI 的 o1 在编码和事实推理任务中略占优势,但 DeepSeek-R1 的开源访问和低成本对用户很有吸引力。

DeepSeek-R1 定价和成本

据报道,DeepSeek 训练其最新 R1 模型的成本仅为558 万美元

这个数字明显低于美国科技巨头为创建替代性法学硕士项目所花费的数亿美元(或数十亿美元)。

例如,据报道,OpenAI 在 GPT-4 训练上花费了 8000 万至 1 亿美元。

OpenAI 首席执行官 Sam Altman 也表示,成本超过 1 亿美元。不过,值得注意的是,这可能包括培训以外的额外费用,例如研究、数据获取和工资。

成本方面另一个明显的差异是每个模型的定价。虽然 DeepSeek 目前免费使用,ChatGPT 也提供免费计划,但 API 访问需要付费。

以下是用户根据使用情况预计花费的比较:

模型 上下文长度 最大 CoT 代币 最大输出代币 100 万代币输入价格(缓存命中) 100 万代币输入价格(缓存未命中) 100 万代币输出价格
deepseek 聊天 64千 8K 0.07 美元 0.27 美元 1.10 美元
deepseek-reasoner 64千 32千 8K 0.14美元 0.55 美元 2.19 美元
GPT-4O 128千 1.25 美元 2.50 美元 10.00 美元

DeepSeek 的定价全面明显较低,其输入和输出成本仅为 OpenAI 对 GPT-4o 收费的一小部分。

虽然 GPT-4o 可以支持更大的上下文长度,但处理输入的成本却高出 8.92 倍。

如何访问 DeepSeek

速率限制和注册限制使人们很难访问 DeepSeek。幸运的是,有三种主要方式可以开始使用:

  • DeepSeek 的网络平台
  • DeepSeek API
  • DeepSeek 移动应用程序

DeepSeek 网页访问

访问 DeepSeek 聊天的最直接方法是通过其网页界面。访问其主页并点击“立即开始”或直接进入聊天页面。

在聊天页面上,系统将提示您登录或创建帐户。

注册后即可访问完整聊天界面。用户可以在提交查询之前选择“DeepThink”功能,以使用Deepseek-R1的推理功能获取结果。

DeepSeek API

DeepSeek 通过 API 提供对其 R1 模型的编程访问,允许开发人员将高级 AI 功能集成到他们的应用程序中。

要开始使用 DeepSeek API,您需要在 DeepSeek 平台上注册并获取 API 密钥。

有关如何使用 API 的详细说明,包括身份验证、发出请求和处理响应,您可以参考DeepSeek 的 API 文档。

DeepSeek 移动应用程序

DeepSeek 可在 iOS 和 Android 平台上使用。

只需在设备的应用商店中搜索“DeepSeek”,安装该应用程序,然后按照屏幕上的提示创建帐户或登录即可。

DeepSeek 会在美国被禁吗?

随着TikTok 在美国禁令迫在眉睫,这始终是一个值得问及有关一家新中国公司的问题。

白宫新闻秘书卡罗琳·莱维特 (Karoline Leavitt) 近日证实,国家安全委员会正在调查 DeepSeek 是否对国家安全构成潜在威胁。

然而,没有迹象表明DeepSeek将在美国面临禁令。美国总统唐纳德·特朗普称DeepSeek的突破为美国科技行业敲响了“警钟”。

未来我们可能会看到更多与应用程序相关的限制。例如,美国海军因安全和道德问题以及不确定性而禁止其人员使用 DeepSeek 的应用程序。

尽管存在这些担忧,但禁止 DeepSeek 可能具有挑战性,因为它是开源的。虽然平台可以限制该模型应用程序,但将其从 GitHub 等平台上删除的可能性不大。

DeepSeek 比 ChatGPT 更好吗?

人工智能领域可以说是目前增长最快的行业。DeepSeek 的崛起无疑引起了全球科技行业的关注。

虽然将 DeepSeek 标记为新的ChatGPT 替代品很诱人,但实际情况却更加微妙。

DeepSeek 在各种基准测试中的表现,特别是在编码和数学推理方面,与 GPT-4o 的能力相当。

这一点,加上 DeepSeek API 的成本效益,对于希望将 AI 功能集成到其产品中的开发人员和企业来说,具有很大的吸引力。

然而,人工智能领域的怀疑论者认为,我们并没有被告知有关 DeepSeek 的训练成本和 GPU 使用情况的全部情况。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注