近日,国产人工智能平台DeepSeek在科技界引发了广泛关注,甚至被认为是大模型行业里的一匹黑马。它的名声迅速传播,无论是在中国还是美国,DeepSeek都成为了业界热议的焦点。尤其是在27日,DeepSeek的应用在苹果应用商店的免费App下载排行榜上成功登顶,甚至超过了广受欢迎的ChatGPT,显示其惊人的市场潜力。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,专注于前沿的大语言模型(LLM)技术及相关的应用开发。该公司在去年12月推出的DeepSeek-V3,一经发布便引起了业界的强烈反响,AI数据服务公司ScaleAI的创始人Alexander Wang在社会化媒体上评论道,DeepSeek-V3正是中国科技界给美国带来的“苦涩教训”。
他指出:“当美国在休息的时候,中国的科技界正在奋战,以更低的成本、更快的速度与更强大的实力追赶。”不久之后的今年1月20日,DeepSeek开源了其R1推理模型。根据DeepSeek的介绍,其最新发布的模型DeepSeek-R1在后训练阶段大范围的应用了强化学习技术,尽管仅使用了极少量的标注数据,依然大幅度的提高了模型推理能力,表现不逊色于OpenAI的GPT-4正式版。
DeepSeek-R1的问世引发了海外AI圈兴奋的讨论。英伟达的高级研究科学家Jim Fan在社交平台上发文称:“我们正处于一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究来赋能整个人类。乍听之下似乎不合常理,但最令人兴奋的结果往往是最大有可能发生的。”CNBC更是议论道:“一家几乎鲜为人知的中国人工智能实验室发布的模型,尽管搭建成本低廉,却超越了美国最优秀的AI模型,令硅谷人心惶惶。”
1月24日,匿名平台teamblind上流传的一则帖子使事态更加引人注目。一名Meta的员工透露,因DeepSeek的模因,Meta内部目前已经感到恐慌。这名员工提到:“一切始于DeepSeek-V3的出现,它在基准测试中将Llama-4远远甩开。更让人感到窘迫的是,此公司竟然花了550万美元的训练预算。这一切让Meta的高层忧虑重重,部门里的高管薪水都已超越了训练整个DeepSeek-V3的成本,如何向上级汇报成为了难题。”
DeepSeek之所以能取得如此迅速的崛起,绝非偶然,而是经过多年的厚积薄发。公司的创始人梁文锋,之前是头部量化私募幻方量化的创始人。从2008年起,他就开始带领团队深入探索机器学习和自动化交易领域。DeepSeek于2023年成立,旨在进军通用AI领域,令人惊讶的是,该公司至今未进行任何对外融资。
《金融时报》曾援引OpenAI前政策主管和Anthropic联合发起人Jack Clark的话称,DeepSeek吸引了一批“高深莫测的奇才”。对此,梁文锋在接受自媒体采访时表示,实际上公司团队并没什么“高深莫测的奇才”,大多数成员都是来自顶尖高校的应届毕业生以及研二、研三的实习生。
DeepSeek小组成员年轻而富有活力,即便是团队领导年龄也普遍在35岁以下。不到140人的团队里,绝大部分的工程师和研发人员都来自清华、北大、中山大学等国内顶尖院校,工作年限普遍较短。
广州日报的报道指出,“DeepSeek爆火的问题大多可以归结为性能和成本。”萨摩耶云科技集团首席经济学家郑磊认为,DeepSeek在后训练阶段大量使用了强化学习技术,通过少量的标注数据就明显提升了模型的推理能力。在先进科技与强大性能的驱动下,DeepSeek吸引了诸多投资者的目光,其潜在的商业经济价值引发了热议。
此外,DeepSeek-R1的另一个与众不同之处在于其极低的成本。DeepSeek表示,R1预训练的费用仅为557.6万美元,只有OpenAI GPT-4训练成本的不到十分之一。同时,DeepSeek公布的API定价也极具竞争力:每百万输入tokens仅需1元(缓存命中)或4元(缓存未命中),而每百万输出tokens的收费为16元,大约是OpenAI运行成本的三十分之一。这使得DeepSeek被称为AI界的“拼多多”。郑磊表示,DeepSeek对硬件市场的影响巨大,这一现象可能会降低人工智能模型的硬件成本,进而推动整个领域的技术革新。
在其发展的激情时刻,DeepSeek26日一度出现了短时的闪崩现象,许多用户在使用时收到“服务器繁忙”的提示。对此,DeepSeek解释称,当日下午确实出现了局部服务波动,但问题在几分钟内得到了解决。此情况或因新模型发布后,用户访问量激增,导致服务器在高并发情况下一时间无法承载。但官方状态页并未将其标记为事故。
游戏科学的创始人、知名制作人冯骥在1月26日对DeepSeek表示了高度赞誉,他认为DeepSeek可能是一个国运级别的科技成果。他说道:“DeepSeek-R1的出现让人感受到当前前沿AI技术的洗礼,希望AI能够越来越平民化,成为人类生活中的水和电。我们都感觉到很幸运!这样的突破,竟然来自于一家中国科技公司,将知识与信息的平权理念推向了又一高度。”
未来,DeepSeek将继续面临挑战与机遇。大数据和AI的前沿发展正加速改变行业格局。而随着DeepSeek在全球市场上的崛起,其成果可能不仅仅是对现有AI公司的一场颠覆,更有望在更长远的未来为全球科学技术进步贡献一份力量。返回搜狐,查看更加多