评论

中国人工智能初创公司 DeepSeek 在全球迅速蹿红

中国ai-startup-deepseek-gains-rapid-global-popularity(中国ai-初创企业深耕细作,快速获得全球知名度

中国人工智能创业公司 深度搜索 在其聊天机器人跃居苹果应用商店和 Google Play 排行榜第一位后,DeepSeek 迅速吸引了全球的目光。DeepSeek 的出现是由先进但成本低廉的人工智能训练方法推动的,这让华尔街的分析师和业内资深人士质疑美国在人工智能领域的持续优势,以及未来对人工智能专用处理器需求的影响。

这种突然的流行引发了这样一个问题:这家以前默默无闻的公司究竟是如何在一个拥挤的行业中崛起的,它又是建立在什么样的基础之上的。有趣的是,DeepSeek 得到了高飞资本管理公司(High Flyer Capital Management)的资金支持,这是一家中国对冲基金,以将人工智能融入其投资策略而闻名。

High Flyer 于 2015 年由人工智能爱好者梁文峰创建,最初是作为一项量化交易计划。在浙江大学求学期间,梁文峰就开始探索算法交易方法,2019 年,他将 High Flyer 扩展为一个完整的对冲基金,利用复杂的人工智能算法进行金融研究和投资。

2023 年,公司从其金融根基中分离出来,将 DeepSeek 建立为一个独立的研究实验室,专注于开发创新的人工智能解决方案。DeepSeek 成立后不久就完全独立,成为一个自主实体,并迅速建立了专有数据设施,以推进其训练能力和雄心壮志。

然而,该公司的发展和国际雄心并非没有遇到重大挑战,主要原因是美国严格的出口限制影响了中国的硬件采购。具体来说,DeepSeek 在获得英伟达(Nvidia)功能强大的 H100 GPU 等顶级芯片时面临重重障碍,被迫依赖于稍逊一筹的英伟达 H800 芯片,而这些芯片是专门禁止出口给中国公司的。

在公司内部,DeepSeek 优先聘用年轻的人才,直接从中国以人工智能著称的名牌大学大量招聘博士级研究人员。值得注意的是,他们还吸纳了来自不同学科背景的员工,以确保公司的产品在不同知识领域保持更广泛的理解和功能,最近一家知名刊物的一篇文章就强调了这一点。

DeepSeek 人工智能模型的快速发展

DeepSeek 最初于 2023 年 11 月展示了其首批机型,包括 DeepSeek LLM、DeepSeek Chat 和 DeepSeek Coder,公开掀起了波澜。然而,几个月后发布的 DeepSeek V2 机型在成本效益和性能方面都比竞争对手的现有产品有了显著提升,从而极大地震撼了科技界。

DeepSeek V2 的出现甚至迫使字节跳动和阿里巴巴等中国主要竞争对手大幅降价,一些人工智能模型服务也随之免费开放。随着第三代旗舰模型 DeepSeek V3 于 2024 年 12 月发布,该公司的发展势头进一步加快,并将自己定位为高性能、可访问的人工智能技术的领导者。

DeepSeek 声称,内部基准评估表明,较新的 DeepSeek V3 显著超越了 Meta 的 Llama 等可公开访问的模型和 OpenAI 的 GPT 4o 等专有选项。2025 年 1 月,DeepSeek 推出了 DeepSeek R1,这是一款专门的人工智能推理模型,旨在生成高度准确且经过深思熟虑的回复,其质量和准确性可与 OpenAI 著名的 o1 模型相媲美。

DeepSeek 的推理模型 R1 有一个值得注意的优点,那就是它具有创新的自我检查能力,能够减少传统模型中常见的误差。然而,在提高精确度和彻底性的同时,它的响应生成时间却有点长,要比标准模型长出几秒甚至几分钟,尽管它大大提高了科学、物理或数学等技术要求较高领域的可靠性。

尽管技术进步令人印象深刻,但由于 DeepSeek 模型源自中国,因此存在固有缺陷。中国政府的互联网法规要求对 DeepSeek 进行严格评估,以确保回复严格遵守官方认可的政治价值观,这导致聊天机器人在回答台湾自治或天安门广场等敏感话题时偶尔会受到严格限制。

三月份的流量分析进一步证明了 DeepSeek 的地位不断提升,尽管流量逐月略有下降,但网站访问量已超过 1650 万次。然而,与行业巨头 OpenAI 的 ChatGPT 相比,DeepSeek 的估计客户足迹仍然黯然失色。

目前,DeepSeek 仍对明确的货币化战略秘而不宣,将产品维持在低于市场水平的定价,甚至公开发布产品,尽管投资者的热情显而易见,但公司并未在财务上呼吁风险投资。公司代表将其竞争力主要归功于效率优化,尽管外部分析师仍在质疑公司提供的财务可行性数据。

尽管如此,开发人员的参与还是有力地彰显了 DeepSeek 的吸引力。 人工智能模型 托管。如此巨大的成功引起了各方的高度关注,包括 Nvidia 的股票估值在去年 1 月明显下降了 18%,以及 Nvidia、微软和 Meta 等公司的高级管理人员就 DeepSeek 不断扩大的相关性所带来的战略考虑发表的公开言论。

与此同时,对地缘政治的担忧也挥之不去,促使包括全球主要政府和机构在内的许多组织直接禁止在官方设备上使用 DeepSeek 应用程序。美国对 DeepSeek 进行了公开审查,而纽约州和韩国则以潜在的国家安全问题和不当的国际影响为由,宣布禁止使用 DeepSeek。

因此,尽管 DeepSeek 的地位不断提升,技术也取得了长足进步,但在国际监管、市场动态和地缘政治竞争中的潜在反弹等方面,DeepSeek 的前进轨迹仍存在不确定性。DeepSeek 如何克服这些障碍,将最终决定其长期生存能力以及对人工智能创新的全球影响。

分享

添加评论

在应用程序中看起来更好

我们使用 cookie 来改善您的网站体验。如果您继续使用本网站,我们将认为您对本网站感到满意。

登录/注册

加入最大的人工智能社区,发现最新的人工智能工具、有用的教程和独家优惠。