满血DeepSeekr1/v3部署方案H100\200与910B参考[V5][

科技梦想家阿山 2025-02-25 15:35:11

满血DeepSeek r1/v3部署方案H100\200与910B参考[V5][点亮平安灯][给力] 高校科研、科研单位院所，算力中心，人工智能创新企业、大型国企等可以参考[玫瑰][玫瑰][玫瑰] sglang目前支持最好，开启nextN（MTP）和torch-compile后，一组h200单线程可以到77t/s。vllm刚支持了MTP，具体还没看到实测。最近vllm不如sglang务实和努力。推理的速度目前差8倍[点亮平安灯]。华为10t/s，英伟达目前已经快到80t/s。agent场景下，v3输出也要1000token左右完成一个thinking，如果用r1做更长，华为是100s才开始动，英伟达是12s。agent应用场景如自动编制文档，20个action起步，华为时间大概30分钟，英伟达是4分钟。机器学习deepseek人工智能AI智囊高校研究生博士科研技术大模型 @北京大学@武汉大学@浙江大学@中国人民大学@厦门大学@重庆大学@山东大学

0 阅读：0

科技梦想家阿山

感谢大家的关注

作者最新文章

1

💥3月26日显卡价格速递：该出手了吗？（附最新价格表👉评论自取，建议收藏

2

英伟达常用GPU参数速查表，B300 收藏备用：含RTX5090、RTX4

3

英伟达RTX50系列显卡GPU参数速查，备用收藏备用：含RTX5090、

4

全网最新：英伟达GPU参数速查表，含GB300 NVIDIA常用GPU参数速查

5

导师委婉和我说… 分享一位生信计算博士生的小吐槽，见到Andy的时候，

6

如何选卡--DeepSeek模型高效推理的秘诀 DeepSeek训推的原生计算

7

满血DeepSeek r1/v3部署方案H100\200与910B参考[V5][

8

《DeepSeek 的强大：变革之力还是潜在挑战？》在当今科技飞速发展的时代

9

英伟达RTX50系显卡参数汇总 | 见图英伟达RTX5090显卡开始预定了.

10

英伟达5090系列发布，5070吊打4090。没时间悼念4090了，真正的美国

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米汽车在安徽高速上的事故，让人万万没想到的不是车门锁死，里面的人出不来，也不是

2

李嘉诚结局已定！和马云的结局惊人相似！还记得马云的蚂蚁金融，在香港

3

红米k80vs红米k90本来年底就是等K80的。一看摄像头那一坨丑到吐的东西

4

华为Mate80可能要成为热门手机，据最新信息显示，华为Mate80带着新技术

5

华为越来越亲民了：华为MateX6折叠屏13999元，贵了；华为MateX

6

小米SU7发生事故之后，不少人都在质问车门为何未能打开。不过，小米作出回应称，用

7

华为手机哪一代处理器更强？Mate10Pro——麒麟970芯片Mate20

8

【拂晓新品说】vivoY300Pro+：-发布时间：2025年03月31日

9

泰国总理佩通坦，竟因一部手机火出圈！在一次重要会议中，泰国总理佩通坦因正在与外

10

华为可能要来搞大事情了，据最新信息显示，这次的华为Mate80有可能会搭载麒麟

科技最新文章

1

泰国总理佩通坦，竟因一部手机火出圈！在一次重要会议中，泰国总理佩通坦因正在与外

2

小米汽车在安徽高速上的事故，让人万万没想到的不是车门锁死，里面的人出不来，也不是

3

【拂晓新品说】vivoY300Pro+：-发布时间：2025年03月31日

4

小米SU7发生事故之后，不少人都在质问车门为何未能打开。不过，小米作出回应称，用

5

华为越来越亲民了：华为MateX6折叠屏13999元，贵了；华为MateX

6

前几天我陪朋友去香港苹果店买手机，买的是iPhone16Pro256GB。

7

华为可能要来搞大事情了，据最新信息显示，这次的华为Mate80有可能会搭载麒麟

8

华为Mate80可能要成为热门手机，据最新信息显示，华为Mate80带着新技术

9

李嘉诚结局已定！和马云的结局惊人相似！还记得马云的蚂蚁金融，在香港

10

华为手机哪一代处理器更强？Mate10Pro——麒麟970芯片Mate20