切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek“朋友圈”再扩容:华为、京东相继加入 云计算 ...
菲龙网编辑部7
有 744 人收听 TA
149748
主题
149765
回复
175947
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/32
广东新春第一会|工行广东省分行韩松:确保全年制造业贷款投放8000亿元 持续推进AIC股权投资试点
0/38
全球商品观察|世界黄金协会:双重驱动下黄金需求创纪录,消费、投资“冰火两重天”
0/38
金饰价格突破860元,专家:黄金现在并非特别值得投资|宅男财经
0/36
人民银行:1月对金融机构开展常备借贷便利操作共171.05亿
0/39
新春走基层|致敬奋斗者,他们默默付出护航“一路平安奔团圆”
0/41
视频 丨 黄金大涨26元!金价又刷新高,继续等待还是抓紧上车?
0/30
深度|宠粉!搞钱!金融机构的小红书“赶考路”
0/34
安达保险获批解散,华泰财险此前已受让其业务
0/31
广东工行:今年确保投放制造业贷款八千亿,科企贷款两千亿
查看TA的全部帖子>>
DeepSeek“朋友圈”再扩容:华为、京东相继加入 云计算、芯片、AI应用公司都来了
时间:2025-2-6 09:42
0
34
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
《科创板日报》2月5日讯(记者 黄心怡)
随着DeepSeek热度飙升,其“朋友圈”也在快速扩容。
今日,京东云宣布正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。前几日,阿里云、百度智能云、华为云、腾讯云、火山引擎、天翼云已接入了DeepSeek模型。海外的亚马逊AWS、微软Azure等云巨头同样官宣支持。
多家国产芯片厂商亦纷纷响应。华为今天宣布DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro上线昇腾社区;DeepSeek-V3满血版在国产沐曦GPU首发体验上线。天数智芯、摩尔线程、海光信息也在2月4日宣布支持DeepSeek模型。而英伟达、AMD、英特尔等海外芯片巨头在更早已完成支持。
此外,无问芯穹、硅基流动等AI基础设施厂商,以及青云科技、PPIO派欧云、云轴科技等独立云厂商,已宣布适配及上架模型服务。
从底层芯片到云服务商,随着DeepSeek朋友圈的扩大,有望进一步推动大模型的低成本化,扩大AI的垂直应用场景。
目前,华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版。科创板上市公司光云科技、当虹软件等也接入DeepSeek系列模型开展应用探索。
▍六大云巨头上线DeepSeek系列模型 推动开源生态发展
DeepSeek旗下大模型“爆火”后,国内主流云平台均陆续上线了相关模型。
今日,京东云言犀AI开发计算平台宣布支持DeepSeek-V3、DeepSeek-R1以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
春节期间,华为云和硅基流动联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。阿里、腾讯、百度、火山引擎等云厂商也上线了DeepSeek系列模型。其中,百度智能云还提出了限时免费的服务方案。至此,国内六大云巨头都已正式支持DeepSeek。
中国云平台集中上线DeepSeek,其背后是云厂商们希望在DeepSeek的火爆浪潮中,吸引更多客户使用其算力和服务。
AI产品榜的数据显示,DeepSeek仅上线18天时日活就突破1500万,而ChatGPT过1500万花了244天,增速是ChatGPT的13倍。上线20天后,DeepSeek日活已达2215万,实ChatGTP日活用户的41.6%,超过豆包的日活用户1695万。
云基础设施厂商有望受益于DeepSeek带来的新叙事,而DeepSeek的成功,也将提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”快速进步。
相比OpenAI的闭源路线,DeepSeek选择了开源的开放路线,这类似于PC时代的Windows和Linux之争。面对DeepSeek的爆火,OpenAI首席执行官萨姆·阿尔特曼此前承认称,OpenAI在开源策略上“站在了历史的错误一边”,并表示需要考虑制定不同的开源策略。
华泰证券认为,开源模型的优势体现在社区共建和技术共享。理论上所有的小参数模型均能够直接利用DeepSeek-R1蒸馏出的标签数据,来增强推理性能。
2025年或是开源模型快速进步的一年,国产大模型进展值得关注。
▍主流国产芯片兼容支持 挑战和机遇并存
在芯片领域,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,同时提供精度性能微调,推理服务化快速部署等能力,
摩尔线程也发文称,已实现对DeepSeek蒸馏模型推理服务的部署。为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。
天数智芯与Gitee AI成功完成了与DeepSeek-R1的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B等。天数智芯还称,正在与并行科技、算力互联等多家伙伴,开展DeepSeek包括R1在内的多款模型的适配与上线,后续即将上线的并行科技平台,不仅面向普通用户和开发者,更是主要面向企业用户的AI服务平台。
Gitee AI联合沐曦于2月2日首发全套DeepSeek-R1千问蒸馏模型,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。2月5日,Gitee AI进一步表示,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。
而海光信息也完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并正式上线。
此外,国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。除R1模型外,国家超算互联网平台还上线了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7b)和DeepSeek-v2系列(Lite)等模型。
“
DeepSeek大模型与国产芯片的适配基本不花时间,而性能优化估计一周完成
。”有算力领域人士介绍。
“当下,主流国产芯片已基本实现对DeepSeek 蒸馏版小模型的兼容支持。这意味着,只要此前能够运行Llama、Qwen这类常见模型,如今便可直接无修改地运行DeepSeek蒸馏版小模型。”魔形智能联合创始人徐凌杰对记者表示,“可以预见,
随着基于 DeepSeek的应用如雨后春笋般爆发,越来越多芯片厂商的入局,新一轮市场竞争与价格调整或许即将拉开帷幕
。”
不过,徐凌杰也指出,满血版的V3和R1拥有6710亿参数,这使得它们对硬件的要求大幅提升。同时,由于采用了此前未被广泛应用的MoE专家并行(EP)策略,其运行需要额外的推理框架支持。
“
目前,仅有少数几家国产芯片成功上线了满血版
。要想完全解锁DeepSeek高性能、低成本的推理优势,
按照官方推荐配置,需在推理的解码部分部署320个GPU,以实现完全的专家并行。这种‘超节点’式的部署方式,对所有国产芯片厂商而言,既是全新的挑战,也是难得的机遇
。”徐凌杰提到。
▍扩大AI的应用场景
谈及未来DeepSeek对国内AI产业链的利好影响,沐曦联合创始人杨建表示,
最大的影响是强化学习的蒸馏流程开源,让大模型在垂直领域的后训练和推理成本急剧下降,同时在垂直领域的可用性急剧上升,同时催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望
。R1蒸馏32B模型的能力逼近OpenAI的O1,使得企业可以私有化低成本部署而不用担心泄密问题,部署意愿极大提高。
TrendForce集邦咨询研究指出,DeepSeek模型虽然降低了AI训练成本,
但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。
光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块,这些模块负责将电信号转换为光信号并通过光纤传输,再将接收到的光信号转换回电信号。TrendForce数据显示,2023年400Gbps以上的光收发模块全球出货量为640万个,2024年约2040万个,预估至2025年将超过3190万个,年增长率达56.5%。
“
实际上从22-24年对大模型应用的风险投资在减少,今年可能会逆转。因为后训练成本急剧下降
。”杨建对《科创板日报》表示。
随着DeepSeek带动模型成本的下降,有望推动AI应用的爆发。科创板上市公司光云科技、当虹科技等都在探索DeepSeek模型的落地应用。其中,快麦小智是光云科技旗下智能客服机器人,其基于大模型的智能体产品绫智的多项业务场景和功能支持DeepSeek各个版本。光云科技方面称,将持续推动旗下AI产品与包括DeepSeek在内的大模型深度适配。
当虹科技BlackEye多模态视听大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。
DeepSeek给AI应用带来更大的想象力,今日金山办公一度触及20cm涨停。不过《科创板日报》了解到,
金山办公尚未与DeepSeek正式合作,有接近金山办公的人士对《科创板日报》记者表示,金山办公正在与Deepseek进行对接测试,未来是否合作要看后续发展
。
在研究层面,杨建预计,各大研究机构都会研究新技术来做预训练和后训练,加快新算法落地。“实际上DeepSeek使用的很多方法是高校研究成果的优秀集成,每年出现那么多新方法,究竟哪些组合才能产生最大产出和价值,可能有很多组合没有被发现,今年肯定有更多的算法创新爆发。DeepSeek只是一个星星之火的燃点。”
在人才方面,杨建判断,大模型应用人才培养会更受重视。“2022-2024年聚集在少数企业,整体业界水平在萎缩。同时,2022-2024年高校并没有培养大模型应用人才。25年春节反应比较快的高校已经开始计划春季大模型应用人才培养,到秋天会覆盖数百所高校会跟随,
今年全国有望培养大模型应用开发人才30-50万
。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部