在过去的五年里,人工智能的使用激增,引发了几个关于这个主题的新会议。然而,最重要的活动已经成为英伟达的图形处理器技术会议(GTC),最近的一次活动上周在加州圣何塞举行。出席人数高达8500人,比GTC17多2000人。(注:英伟达是ZK研究公司的客户。)
虽然展会由英伟达主办,但它已经成为一个行业展会,扩展AI的一些最大挑战正在被讨论和解决。
按照GTC的惯例,英伟达已经发布了许多公告。以下是我认为最有趣的内容,也是首席信息官应该关注的原因。
GPU计算面临的挑战之一是将足够的数据推入GPU以保持其繁忙,尤其是对于多GPU系统。一般在高数据负载下,PCI总线的速度太慢,所以英伟达开发了一种专有的互连,它桥接两个GPU(称为NVLink)绕过PCI总线。在GTC18上,英伟达首次引入了一项名为NVSwitch的创新技术,该技术能够通过高速结构将16个GPU连接在一起。
首席执行官黄仁勋在主题演讲中展示了16个GPU系统中的一个,并开玩笑说它是世界上最大的GPU,因为它有效地创建了一个大型GPU。网络专业人士会很熟悉这种架构,因为这种纵横制交换矩阵被用作当今大多数高速交换机的互连,所以被称为NVSwtich。
为什么首席信息官要关心:企业必须分析的数据量只会增加。事实上,使用通用对抗网络(GAN)可以使机器生成自己的综合数据。NVSwitch帮助组织互连更多的GPU,以便数据科学家能够处理更大、更复杂的数据集。
大约一年前,英伟达推出了特斯拉V100 GPU,配备了16GB的HBM2内存。该公司在GTC18上宣布,将立即将总内存增加一倍,达到32 GB。升级英伟达意味着现在英伟达与其主要竞争对手AMD之间的内存平价。V100的性能对于类似的AMD产品来说总是吹嘘。然而,总内存是它落后的地方——现在它已经缩小了差距。