收起左侧
发新帖

美国AI公司尝试找出DeepSeek的漏洞

时间:2025-1-28 17:22 0 923 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
【菲龙网专讯】美国领先的AI公司开发者称赞DeepSeek AI模型的崛起,同时也在尝试质疑这一中国新兴企业的低成本替代方案是否真的超越了他们的数十亿美元技术。

image.png

中国初创公司DeepSeek于1月27日引发股市抛售,其免费的AI助手超越了OpenAI的ChatGPT,登上了美国苹果应用商店的榜首。DeepSeek表示,该公司使用Nvidia较低性能的H800处理器芯片,以不到600万美元的预算训练了这一模型。

在美国股市中关于竞争的担忧不断蔓延时,一些AI专家赞扬DeepSeek强大的团队和前沿的研究,但并未对这一发展产生太大反应。据知情人士透露,四家领先AI实验室的人员表示,他们未对这一事件做出过度反应,原因是他们未被授权公开讨论此事。

OpenAI首席执行官Sam Altman在X上写道,DeepSeek最近发布的多个模型之一R1,“是一个令人印象深刻的模型,特别是在它们能够提供的价格方面。”Nvidia在一份声明中表示,DeepSeek的成就证明了对更多Nvidia芯片的需求。

软件公司Snowflake决定在1月27日将DeepSeek模型添加到其AI模型市场,因为公司收到了大量客户询问。

Snowflake的产品执行副总裁Christian Kleinerman表示,尽管员工也称DeepSeek的模型“令人惊叹”,但Snowflake在决定是否支持来自中国的AI技术之前,评估了潜在的风险。

他说:“我们决定,只要我们向客户说清楚,我们认为支持它没有问题。”

与此同时,美国AI开发者正在加紧分析DeepSeek的V3模型。DeepSeek在去年12月发布了伴随该模型的研究论文,该论文是其热门应用程序的基础,但许多问题,如总开发成本,未在文件中得到解答。

有消息人士称,中国的AI技术现在已经从18个月的滞后时间缩短至6个月,赶超美国的最先进AI模型。然而,随着DeepSeek免费发布策略引发如此大的关注,该公司可能很快会面临芯片供应不足以满足需求的局面。

DeepSeek的进步并非完全来源于仅600万美元的预算,这一数额相较于美国大型云公司今年预计将花费的2500亿美元AI基础设施投入来说微不足道。研究论文指出,这一成本特指其最终训练过程中使用的芯片费用,而非整个开发过程的总成本。

两家顶级实验室的高管告诉路透社,训练过程只是成本冰山的一角。设计这一训练过程所需的费用可能会高出几个数量级。

该论文还指出,V3模型的训练使用了2048颗Nvidia的H800芯片,这些芯片设计时遵循了美国2022年发布的出口管制规定。专家告诉路透社,这些规则几乎不会减缓中国AI技术的进展。

两家AI实验室的消息人士表示,他们预计DeepSeek在早期开发阶段可能依赖了大量芯片资源。有人表示,这样的投资可能超过10亿美元。

一些美国AI领袖赞扬DeepSeek将其模型开源的决定,这意味着其他公司或个人可以自由使用或修改这些模型。

风险投资家Marc Andreessen在周日的X发布中写道:“DeepSeek R1是我见过的最令人惊叹和印象深刻的突破之一,作为开源项目,它是对世界的深刻馈赠。”

行业观察人士表示,DeepSeek模型获得的赞誉突显了开源AI技术作为一种替代昂贵且高度控制的技术(如OpenAI的ChatGPT)的可行性。

华尔街最有价值的公司近年来因预期只有它们拥有必要的资本和计算能力来开发和规模化新兴的AI技术而股价飙升。然而,这些假设将受到更多审视,尤其是在美国科技巨头即将公布季度财报的这一周和下周。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部