如何选卡--DeepSeek模型高效推理的秘诀 DeepSeek训推的原生计算

科技梦想家阿山 2025-03-06 17:37:12

如何选卡--DeepSeek模型高效推理的秘诀 DeepSeek训推的原生计算精度FP8、FP16、FP32三种，英伟达也只有Ada、Hopper和Blackwell架构同时支持。 A100/A800是Ampere架构，不支持FP8 (x) RTX4090是Ada架构，同时支持三种计算精度 (V) RTX5090是Blackwell架构，同时支持三种计算精度 (√) H100/H800是Hopper架构，同时支持三种计算精度 (√) H200/H20是Hopper架构，同时支持三种计算精度。(√) 500G显存只可以跑4bit版本的满血R1，真IFP8版本要900G以上显存性能测试 1台 141GB 8卡H200，价格220w，速率3780token/s(NV官方测试) 2台80GB 8卡A100，价格200w，速率1200token/s(实测测试) 2台 48GB 8卡4090，价格60w，速率1800token/s(实际测试)。 3台 32GB 8卡5090，价格140w，速率3500token/s(预估计算值)。 RTX4090 48G显存版本最具性价比，其次是RTX5090 8卡H200单台机器可以跑满血DeepSeek-R1671B版本

0 阅读：0

科技梦想家阿山

感谢大家的关注

作者最新文章

1

💥3月26日显卡价格速递：该出手了吗？（附最新价格表👉评论自取，建议收藏

2

英伟达常用GPU参数速查表，B300 收藏备用：含RTX5090、RTX4

3

英伟达RTX50系列显卡GPU参数速查，备用收藏备用：含RTX5090、

4

全网最新：英伟达GPU参数速查表，含GB300 NVIDIA常用GPU参数速查

5

导师委婉和我说… 分享一位生信计算博士生的小吐槽，见到Andy的时候，

6

如何选卡--DeepSeek模型高效推理的秘诀 DeepSeek训推的原生计算

7

满血DeepSeek r1/v3部署方案H100\200与910B参考[V5][

8

《DeepSeek 的强大：变革之力还是潜在挑战？》在当今科技飞速发展的时代

9

英伟达RTX50系显卡参数汇总 | 见图英伟达RTX5090显卡开始预定了.

10

英伟达5090系列发布，5070吊打4090。没时间悼念4090了，真正的美国

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米汽车在安徽高速上的事故，让人万万没想到的不是车门锁死，里面的人出不来，也不是

2

李嘉诚结局已定！和马云的结局惊人相似！还记得马云的蚂蚁金融，在香港

3

伤害不大，侮辱性极强。抄袭是可耻的华为手机发布会之后，全体都沉默了就连库克和

4

这是不是雷军最想删除掉的一张照片

5

手机信号哪家强？这四款旗舰闭眼入！要说近期最值得入手的真香机，荣耀Magic

6

网友总结的各家手机使用年限:1、苹果手机：5-7年，电池可能老化2、华为，3

7

红米k80vs红米k90本来年底就是等K80的。一看摄像头那一坨丑到吐的东西

8

鸿蒙NEXT正式版本5.0.1.105正式版更新11.2G这个更新包大的吓人

9

曾经的手机系统，如今只剩三家，哪个比较惋惜

10

华为Mate80可能要成为热门手机，据最新信息显示，华为Mate80带着新技术

科技最新文章

1

手机信号哪家强？这四款旗舰闭眼入！要说近期最值得入手的真香机，荣耀Magic

2

终于知道为什么su7事故司机家属要紧逼小米回应了因为我们的法律规

3

我猜到了小米会发声，也猜到了雷军会表态但却万万没想到，他会通过

4

对比16Pro，iPhone17Pro真的香爆！最近iPhone17系

5

泰国总理佩通坦，竟因一部手机火出圈！在一次重要会议中，泰国总理佩通坦因正在与外

6

鸿蒙NEXT正式版本5.0.1.105正式版更新11.2G这个更新包大的吓人

7

小米汽车在安徽高速上的事故，让人万万没想到的不是车门锁死，里面的人出不来，也不是

8

【拂晓新品说】vivoY300Pro+：-发布时间：2025年03月31日

9

小米SU7发生事故之后，不少人都在质问车门为何未能打开。不过，小米作出回应称，用

10

华为越来越亲民了：华为MateX6折叠屏13999元，贵了；华为MateX