切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek官方测算模型成本利润率为545%
菲龙网编辑部7
有 744 人收听 TA
151008
主题
151025
回复
177247
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/75
AI抢饭碗的时代要来了?一大型银行未来三年内预计裁员4000人
0/68
金价暴跌!有投资者囤10公斤黄金被套牢
0/73
逾700亿元险资投向股权领域,未来上升空间还有多大?
0/67
接入DeepSeek!险企“狂飙”
0/72
中兴通讯:2025年度拟使用不超300亿元自有资金进行委托理财
0/78
评评“理”第 26期:连续两年浮亏、近3个月却收益亮眼,一产品卖出4万多笔登上邮储银行APP热销榜丨银行热销理财产品测评系列
0/65
债市下跌冲击,6-12个月期限纯固收产品近1年平均收益率跌破3%丨机警理财日报
0/66
75亿国资入局! 这家新银行将如何搅动农村金融市场?
0/71
中央一号文件首提“农业新质生产力” 多家银行加码涉农贷款
查看TA的全部帖子>>
DeepSeek官方测算模型成本利润率为545%
时间:2025-3-3 09:36
0
105
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
3月1日,DeepSeek官方通过社交媒体账号公布了其线上系统的实际统计数据,称如果所有tokens全部按照DeepSeek R1的定价计算,理论上成本利润率为545%。
DeepSeek官方公布,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。
另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。在最近的24小时里(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为 8 个 H800 GPU)。假定GPU租赁成本为2美金/小时,总成本为$87,072/天。
在24小时统计时段内,DeepSeek V3和R1:
输入token总数为608B,其中342B tokens(56.3%)命中KVCache硬盘缓存。 输出token总数为168B。平均输出速率为20~22 tps,平均每输出一个token的KVCache长度是4989。 平均每台H800的吞吐量为:对于prefill任务,输入吞吐约73.7k tokens/s(含缓存命中);对于decode任务,输出吞吐约14.8k tokens/s。
以上统计包括了网页、APP和API的所有负载。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。
DeepSeek官方表示,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。
本文系观察者网独家稿件,未经授权,不得转载。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部