您的位置:扒贴网 > 百态 > 正文

​黄仁勋:新的 H200 芯片我就做了两件事,就让你们疯狂

摘要黄仁勋:新的 H200 芯片我就做了两件事,就让你们疯狂 事实上当英伟达在 11 月 13 日宣布推出 H200 张量核心 GPU 的时候并没有让人感到很意外。 毕竟在 8 月 30 日,英伟达就发布了旗下...

黄仁勋:新的 H200 芯片我就做了两件事,就让你们疯狂

事实上当英伟达在 11 月 13 日宣布推出 H200 张量核心 GPU 的时候并没有让人感到很意外。

毕竟在 8 月 30 日,英伟达就发布了旗下 GH200 Grace Hopper 将要搭载 HBM3e 的消息,目的就是为了下一个张量核心的 GPU 产品在性能有着绝对的优势。但是当黄仁勋站在台上,大声念着屏幕上 H200 的详细参数时,除了夸张,就只剩下夸张。

简单过一下参数,H200 的显存是 141GB,带宽是每秒 4.8TB。因为此次推出的是 SXM 版本,也就是带一个高带宽插座版本。所以对比 H100 的 SXM 版本,显存从 80GB 提升 76%,带宽从每秒 3.35TB 提升了 43%。但这不是最主要的,无论是 H100 还是 H200,它都是专注于人工智能复杂计算的,所以在业务方面,Llama2 700 亿参数的模型推理速度提高了 90%,GPT-3 1750 亿参数的推理速度提高了 60%。

这就让人不禁好奇,因为从浮点计算能力来说,那肯定是数字越大越厉害。但是从面板来看,同样为 SXM 版本的 H100 和 H200,无论是 FP64 还是其他精度,两者皆是完全相同的。要知道 H100 的单 PCIe 版本整个浮点精度都要比 SXM 版本低,因此它的带宽只有每秒 2TB,上文提到 H100 的 SXM 可是有每秒 3.35TB,浮点精度之间的差距会带来性能差异,那精度相同的两张卡,咋就也产生差异了?

左为 H200,右为 H100 内功叫做 HBM3e

这就好像武侠里面那老头,看起来手无缚鸡之力,一出手直接能打翻成年壮汉,这便是 " 内力 "。H200 这次采用的是和 H100 相同的 hopper 架构,最大的区别是搭载了上文已经提到过的 HBM3e。先拆分一下这几个英文字母,HBM 全称为高带宽内存,是一种利用三维同步动态随机存取技术(SDRAM)构建的内存接口,指的是利用垂直概念来扩展内存同时大幅度增加堆栈内处理速度。说白了就是过去内存里面大家都是一字长蛇阵排开,第一个处理完业务才能让下一个进来,没利用到空间,只是利用到平面。而到了 HBM 这里,设立了多窗口服务,只不过是垂直于地面建立的,排队速度更快。

另一方面,动态随机访问存储器,也就是常说的 DRAM 和 SDRAM 相比,SDRAM 是在 DRAM 的架构基础上增加同步和双区域(Dual Bank)的功能,使得微处理器能与 SDRAM 的时钟同步,所以 SDRAM 执行命令和传输资料时相较于 DRAM 可以节省更多时间。排队窗口增加了,排队速度也加快了,因此整体效率自然而然升高了。最后到了 3e,3 就是第三代架构,e 就是第三代架构的威力加强版,和游戏里 DLC 差不多一个概念。

英伟达 H100 采用的是 SK 海力士在 2022 年 6 月生产的 HBM3(PCIe 版 H100 用得是 HBM2e,这里补充说明一下),这款内存产品堆栈内存带宽是每秒 819GB。HBM3e,则是对 HBM3 在同一架构下,对用料、逻辑、算法的升级,内存带宽足足提升了 25%,来到每秒 1TB。那么回到一开始提出的问题,Llama2 模型的运行大抵都遵守每 10 亿参数耗费 3 到 5GB 内存的原则,不过这个是会随版本更新、算法优化而变少的,毕竟开发者也为了防止内存溢出,进而发生不可预估的错误。等于说是,内存越大运行效率越快。

不过这才提升了 25% 啊!别急,英伟达的狠活还在后面。都说内练一口气,可别忘了,还要外练筋骨皮。H200 和 H100 都是采用 Hopper 架构这个不假,然而英伟达为前者其进行了 " 武装 " —— TensorRT-LLM。英伟达 TensorRT-LLM 是由 TensorRT 深度学习编译器组成,包括优化的内核、预处理和后处理步骤以及多 GPU/ 多节点通信原语。

外功叫做 TensorRT-LLM

TensorRT-LLM 的工作原理类似于 " 高斯求和 " 的故事,别的小朋友还在算等差数列依次相加的时候,高斯直接掏出一个公式很快算出了结果。TensorRT-LLM 就相当于是这么一个公式,以软件优化的方式帮助 GPU 快速解决复杂计算。以 H100 为例,使用 TensorRT-LLM 后的 H100,在对一些媒体网站进行文章摘要时的工作效率,比使用前快出整整 1 倍。而在 700 亿参数的 Llama2 上,前者比后者快 77%。这个东西英伟达没敢在 H100 上大肆宣扬,直至今年 8 月时才拿出来大晒。

事实上英伟达耍了一个花招,在官网对比上,H200 SXM 对比的是没有使用 TensorRT-LLM 的 H100 SXM,当然这是后话,毕竟本身 TensorRT-LLM 也不是为 H100 准备的。综上,内功上英伟达有了 HBM3e,外功上有了 TensorRT-LLM,因此在没有计算精度变化的前提下,才能在性能上高出上代产品那么多。

2023 年年初的时候,英伟达收盘在 140 多块左右,发布完了 H200,截止至写稿,收盘在 489 块,距离年初涨了 230%。行了,老黄这回算彻底疯狂了,我要是他估计我比他还狂呢。可我说停停,今年 6 月的时候一位英伟达一直以来的死对头,黄仁勋大舅罗伯沐的孙女,也就是黄仁勋的表外甥女苏姿丰站了出来。她拿出了一块 AMD 用来挑战 H200 地位的 GPU —— MI300X。

苏姿丰与 MI300X

别看 MI300X 依然使用 HBM3 内存,但是 AMD 来了一招 " 加量不加价 ",MI300X 的内存达到了 191GB,比 H200 还足足高了 35%。191GB 放在 GPU 里是个怎么回事?H100 有一个版本叫做 H100 NVL,这个版本非常简单粗暴,它是用两个 PCIe 版本的 H100 直接焊在一起,产生 1+1>2 的效果,这也才让内存来到 188GB,MI300X 单单一块就是 191GB。然而大也有大的不好,MI300X 额定功率是 750W,比 H200 多了 50W。功率和内存不一样,是反着来的,它是越小越好,越低的额定功率代表设备的维护成本越低,越耐用。一般来说,人工智能实验室不会只使用一块 GPU 产品,他们大多都是复数购买,每块 MI300X 都比 H200 多 50W 额定功率的话,最后很可能聚沙成塔,导致失去竞争力。

对于英伟达来说还有一个头疼的问题,中国几家互联网巨头一直是 A100 和 H100 的忠实客户,不过美国随后很快就禁止了向中国销售这两块 GPU 产品。雪上加霜的是,随着美国在 2023 年 10 月发布的禁令,A100 和 H100 的中国定制版 A800 和 H800,也要在 11 月 17 日以后禁止向中国销售了。从财报上来看,英伟达数据中心大约 25% 的收入是来自于中国,H200 不出意外的话应该很快就会被列为禁止向中国出售的产品之一。

标签:

推荐阅读

  • ​北京小学男生亲吻女生后,“好哥们”却打抱不平:他们之间是真爱

    北京小学男生亲吻女生后,“好哥们”却打抱不平:他们之间是真爱 (接上文:因为打赌,北京小学男生亲吻同班女生!女班主任:你不该如此随意) 一封“求情”的信 不承想,家长...

    2023-11-20 12:34:36
  • ​北京地铁1号线

    北京地铁1号线 北京地铁1号线,又称北京地铁一线。是北京最早的地铁线路,也是中国最早的地铁线路,起初是为军事战略防备、防空准备的(西起高井站,东至立新站),后成为了对...

    2023-11-20 12:32:20
  • ​约 200 人死亡!以军袭击加沙北部一学校,多国发表声明谴责!

    约 200 人死亡!以军袭击加沙北部一学校,多国发表声明谴责! 据央视新闻 11 月 19 日援引多家巴勒斯坦媒体 18 日报道, 以色列军队当天袭击了位于加沙地带北部杰巴利耶难民营内的法...

    2023-11-20 12:30:04
  • ​直击 2023 国家医保谈判首日:保密工作升级,简易续约新规即将落地,药企提前

    直击 2023 国家医保谈判首日:保密工作升级,简易续约新规即将落地,药企提前 踩点 本文来源:时代财经 作者:张羽岐 李傲华 11 月 17 日,北京全国总工会国际交流中心,为期 4 天的...

    2023-11-20 12:27:49
  • ​藏水入疆干了吗?印度比我们更关注!揭秘“红旗河工程”进度

    藏水入疆干了吗?印度比我们更关注!揭秘“红旗河工程”进度 青藏高原,素有中国水塔之称;新疆沙漠,干旱缺水已是共识。如果把西藏的水送到新疆去,是不是皆大欢喜?于是“红...

    2023-11-20 12:25:33
  • ​诡计多端是褒义词还是贬义词 诡计多端的造句

    诡计多端是褒义词还是贬义词 诡计多端的造句 诡计多端是褒义词还是贬义词 诡计多端的造句?诡计多端的意思就是一个人的坏点子非常的多。它的反义词就是足智多谋。 成语出自罗贯...

    2023-11-19 08:10:50
  • ​超市老板娘深夜接到订单,果断报警!

    超市老板娘深夜接到订单,果断报警! 超市老板娘深夜接到订单 果断选择报警 究竟是怎么回事 …… 10 月 30 日晚 11 点 30 左右 浙江海宁海昌路上的 美佳乐超市老板娘余清兰 接到了外...

    2023-11-19 08:08:35
  • ​湖北省会在哪?湖北省会是哪个城市?

    湖北省会在哪?湖北省会是哪个城市? 湖北省会在哪?湖北省会是哪个城市?湖北省,简称“鄂”,别名楚、荆楚,中华人民共和国省级行政区,省会武汉。地处中国中部地区,东邻安徽...

    2023-11-19 08:06:19
  • ​一分钟带你了解斐洛里庄园

    一分钟带你了解斐洛里庄园 斐洛里庄园位于美国加利福尼亚州,旧金山以南约 40 公里。 庄园占地约 2.6 平方公里,包括一座约 5000 平方米的宅邸、约 65000 平方米的英式花园,以及大面...

    2023-11-19 08:04:03
  • ​小米汽车拿到工信部准生证:北汽代工,宁德时代、比亚迪供应电池

    小米汽车拿到工信部准生证:北汽代工,宁德时代、比亚迪供应电池 11 月 15 日,工信部发布《道路机动车辆生产企业及产品公告》(第 377 批),小米汽车赫然在列。 公告显示,小米...

    2023-11-19 08:01:47
  • ​广陵是现在的哪里 广陵是江苏省哪个市

    广陵是现在的哪里 广陵是江苏省哪个市 广陵是现在的哪里 广陵是江苏省哪个市?广陵指的是江苏省哪个市古代广陵指的现在的江苏扬州市。扬州,古称广陵、江都、维扬,建城史可上溯...

    2023-11-19 07:59:31
  • ​南阳市宛城区人民政府征收土地预公告

    南阳市宛城区人民政府征收土地预公告 仲景街道办事处东关社区、校场社区: 根据《中华人民共和国土地管理法》第47条规定,南阳市人民政府为实施公共利益,落实土地利用总体规划...

    2023-11-19 07:57:15
  • ​户字旁的字和啥有关?户字旁的字都有哪些?

    户字旁的字和啥有关?户字旁的字都有哪些? 户字旁的字和啥有关?户字旁的字都有哪些?本篇文章给大家说说户字头的字与什么有关,以及户字头跟什么有关系对应的知识点,希望对...

    2023-11-19 07:55:00
  • ​花甲之年是指多少岁?

    花甲之年是指多少岁? 花甲之年是指多少岁?花甲是一个名词,但是这个词的意思是指一个人的岁数称谓,比如二十弱冠,三十而立等等,到了花甲岁数,想必已经步入了中老年界限,...

    2023-11-19 07:52:43
  • ​癸卯年是什么含义?哪一年是癸卯年?

    癸卯年是什么含义?哪一年是癸卯年? 癸卯年出生的人往往都会对一些生活中的闲事都不加理会的,在中年时期中发展才会比较顺,那么癸卯年是什么含义?哪一年是癸卯年?下面一起...

    2023-11-19 07:50:27
  • ​南宁舰:舷号162,052D导弹驱逐舰

    南宁舰:舷号162,052D导弹驱逐舰 2月20日至24日中国人民海军南宁舰才赴阿联酋参加阿布扎比国际海事防务展。 4月26日又与887号“微山湖”综合补给舰联手完成撤侨。撤侨到达沙特吉达...

    2023-11-18 09:07:28
  • ​杭州跳楼2023

    杭州跳楼2023 杭州跳楼2023?4月18日中午12时30分许,“杭州女童坠楼案”在杭州拱墅区人民法院结束审理。在经过一上午的审理后,法院宣布休庭,将择期宣判。 杭州四季青雪儿老板娘跳楼...

    2023-11-18 09:05:12
  • ​南京两日游路线分享

    南京两日游路线分享 如果你准备了两天的时间到南京旅游,但是不知道怎么玩,那就看下这篇攻略吧。 住宿: 可以选择夫子庙附近,这里交通非常方便,南京的大多数景点都可以乘坐...

    2023-11-18 09:02:56
  • ​安徽铜陵著名景点!凤凰山

    安徽铜陵著名景点!凤凰山 早在明朝“景泰”年间,诗人周铎就书写“庐外山高插半天,石边孤井聚甘泉,凤凰一饮千年后,尚有遗迹万古传”等十六首“凤凰八景”组诗赞美过凤凰山...

    2023-11-18 09:00:40
  • ​矮个子男人就不配得到爱情吗?听听这3个女人的大实话

    矮个子男人就不配得到爱情吗?听听这3个女人的大实话 很多女孩子心目中白马王子的形象是“高富帅”,所以“矮穷挫”很难入得了女孩子们的法眼。之前有看见一些自媒体的街边采...

    2023-11-18 08:58:24