GPU H200 - 搜索 News

1 天

吞吐量30倍提升！NVIDIA秀Blackwell性能：打破MLPerf记录居第一

具体来看，GB200 NVL72系统通过连接72个NVIDIA Blackwell GPU，作为一个单一的超大GPU运行，在Llama 3.1 405B基准测试中，与H200 NVL8相比，实现了高达30倍的吞吐量提升。

腾讯网23 小时

AI推理芯片，最新排名

目前，英特尔似乎已经退出了 AI 加速器芯片之争。其 Nvidia H100 的替代品Gaudi 3既未出现在新的 MLPerf 结果中，也未出现在去年 10 月发布的 4.1 版中。Gaudi 3 ...

10 天

AMD MI300X引领AI计算新纪元，性能超越H200

在人工智能技术不断发展的今天，AMD近日发布的MI300X显然成为行业的焦点。这款采用最新架构的GPU在运行DeepSeek-R1模型时，其表现引发了广泛关注——其性能在相同延迟条件下吞吐量最高可达到英伟达H200的五倍。在并发处理能力上，MI300X甚至可以在Token间延迟不超过50毫秒的情况下，支持128个并发请求，而H200仅能支持16个，这彻底打破了以往计算能力的极限。

9 天

DigitalOcean 借 Flexential 亚特兰大数据中心，部署英伟达 H200

据香港IDC新天域互联了解，云服务企业 DigitalOcean 与 Flexential 达成合作协议，将在 Flexential 的亚特兰大 - 道格拉斯维尔数据中心开展高密度 GPU 部署，旨在为不断攀升的人工智能（AI）及机器学习（ML）工作负载提供有力支撑。

10 天

AMD跑DeepSeek性能超H200！128并发Token间延迟不超50ms，吞吐量达H200五倍

在稍早一些的测试当中，使用SGLang在MI300X上运行DeepSeek-R1，仅过了两周就相比于day 0时性能提升到了4倍，吞吐量达到了每秒5921 Tokens。 [1] https://rocm.blogs.amd.com/artificial-intelligence/DeepSeekR1-Part2/README.html ...

腾讯网7 小时

GPU，CPU，谁是谁的“伴侣”？—— 阿里 RTP 平台的异构资源解耦大冒险

作者 | 刘侃审校 | Kitty前言RTP（Real Time Prediction） [1] 平台是阿里内部一个通用的在线预测平台，广泛支持淘天、本地生活、AIDC、菜鸟、大文娱等搜索和推荐业务场景的 DLRM（Deep Learning Recommendation Model）部署。自 2022 年起，RTP 开始探索大规模 GPU-Disaggregation 技术的落地，运用 RDM ...

来自MSN4 个月

英伟达发布新AI硬件：H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片

此外 h200 nvl pcie gpu 支持双路或四路的 900gb/s 每 gpu 的 nvlink 桥接器互联。英伟达表示 h200 nvl 内存容量是此前 h100 nvl 的 1.5 倍，带宽也达 1.2 倍，拥有 ...

14 天

想一想英伟达的AI高性能GPU几万美元一

想一想英伟达的AI高性能GPU几万美元一个，3-5年后会到几千人民币一个吗？一旦如此，今天英伟达的股价估值该如何？用市盈率、市梦率还是基于十年期国债收益率？ H100：这是英伟达专为人工智能打造的高性能GPU，目前出厂价约为3.5万美元左右，折合人民币约为25万元。一个大模型就不得不用几万块，太可怕了。 H200：也是一款性能强劲的GPU，有消息称其单卡价格也较为高昂。例如市场上曾有8颗英伟达H2 ...

来自MSN6 个月

由英伟达H200 GPU提供支持的Amazon EC2 P5e实例正式可用

Amazon EC2 P5e实例提供8个英伟达H200 GPU，具有1128GB高带宽GPU内存，同时提供第三代AMD EPYC处理器，2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5e实例还提供 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果