《财富》大部分美国500强50岁以上的CEO都没有纹身,更别说纹身是自己公司的商标了。但是出生在* * * *的黄仁勋并不属于大多数。首先,他在与合伙人共同创办公司24年后仍留在商界实属罕见。黄仁勋不仅是一名训练有素的电气工程师(曾就读于俄勒冈州立大学和斯坦福大学),还是一名强有力的高管,善于用鼓励和暴风雨般的假日邮件(在他的假期,而不是员工的假期发送)来领导员工。据很多业内人士说,他充满远见,很早以前就预见到一种新的计算方法会带来一个蓬勃发展的市场,从而提前很多年重新定位自己的公司。这一愿景,以及该公司惊人的财务业绩,使黄仁勋从0755到79000成为年度商人。Godfried Adobe的首席执行官Santa Nu narayan说:“黄仁勋是一个罕见的将惊人的远见和不懈的执行结合在一起的人。由于英伟达专注于人工智能领域,领导层有无限的机会可以把握。”英伟达三次投资的旧金山数据库公司MapD的首席执行官托德莫斯塔克(Todd Mostak)说:“我认为黄仁勋是杰夫贝索斯和埃隆马斯克的人物。”

无论走到哪里,英伟达的首席执行官黄仁勋总是强调我们是一家人工智能公司。谁能说不呢?市值两年涨了7倍,芯片供不应求。它曾多次与英特尔对抗,并坚持谷歌。是当前AI普及的有力选手,也是AI大潮中最闪亮的明星缩影。成立24年来,从游戏芯片供应商到AI芯片垄断者,英伟达创造了历史。但是,如果我们回顾英伟达的历史事件,即使历史进程不可或缺,个人奋斗也不容忽视。没有——濒临破产时的豪赌,没有CUDA的百亿豪赌,怎么会有今天风光无限的英伟达和黄志学?《财富》记者唐克拉克决定揭秘英伟达“奇幻漂流”背后的关键时刻。这不仅仅是一个赌奇迹的案例。英伟达的转折点是“CUDA”。

CUDA,NVIDIA的并行计算平台和编程模型。在它出现之前,英伟达的主芯片GPU只是一个负责在屏幕上绘制图像的“图形处理单元”。但是CUDA的出现让GPU具备了解决复杂计算问题的能力,可以帮助客户针对不同的任务对处理器进行编程。比如远在波兰的图像识别公司CTA.ai,就可以用它来帮助筛选肠道图像——。只需要患者吞下一个药丸大小的传感器,医生就能比文章检查快70%检测出肠道功能障碍,不仅降低了检查成本,还能让诊断更加准确。对于类似的GPU应用,CTA.ai并不孤单。GPU也在越来越多的新兴设备中出现,比如无人车、机器人、自动驾驶汽车、服务器、超级计算机、虚拟现实设备等。几乎是AI市场的核心需求类别,因为只有英伟达的GPU才能快速处理各种复杂的人工智能任务,比如图像识别、人脸识别和语音识别,甚至深度学习加速、气候建模、石油勘探等。GPU必须是标配。事实上,这个应用远远超出了老黄最初的预期。黄仁勋出生于* * *,在俄勒冈州立大学和斯坦福大学学习电子工程,后来在硅谷做芯片制造商。1993年,他与克里斯马拉乔斯基(Chris Malachowsky)和柯蒂斯普里姆(Curtis Priem)一起创立了英伟达。最初,他们为游戏PC提供视觉效果,以帮助它们与那些专业的文章游戏主机竞争。Malachowsky表示,该公司最初的产品并不成功,图形市场上有许多竞争对手。后来,英伟达重组产品和策略,逐渐与对手拉开距离,最终成就了GPU加速卡在游戏PC中的绝对领先地位。GPU生成三角形形成框架结构,模拟物体,给显示屏上的像素赋予颜色。要做到这一点,许多简单的指令必须并行执行,这就是为什么图形芯片的性能随着微处理器数量的增加而优化。如何最大化这些微处理器的并行计算能力,一直是NVIDIA最核心的关注点。也是CUDA诞生的原因。实习生代表作2004年,斯坦福大学博士生Ian Buck进入英伟达实习,这是CUDA研发的开始。当时Buck参加了一个编程比赛,任务是让管理GPU的很多计算引擎变得更容易。CUDA的核心设计理念是计算机中的线程。不同于4、8和传统CPU中的16个线程,GPU中可以有上万个线程。巴克说,看起来管理这些线程是一件非常复杂的事情。但事实上,程序员的主要困难是如何利用这些线程,而不是管理它们。在早期,CUDA的性能主要依靠程序员手动寻找代码中可以并行计算的部分。目前,随着CUDA库的发展,这项工作越来越自动化。CUDA团队开发了许多用于石油、天然气和国防工业的科学计算库。最后,2012年发布的泰坦超级计算机使用18688个NVIDIA Tesla K20 GPU作为协处理器,标志着GPGPU在高性能计算领域的成功推广和应用。从2011年开始,Top 500中至少有50台超级计算机将使用GPU进行加速。而且这些机器基本都出现在绿色500强(全球节能超级计算机排行榜)的名单中。Buck曾经说过,在CUDA的应用中,乳腺癌检测和诊断系统是最有影响力的。与传统方法相比,医生使用支持CUDA编程的特斯拉GPU后,可以更早、更准确地发现乳腺癌。根据美国国家癌症研究所的数据,基于CUDA的系统只需要原来1/12的时间来运行蛋白质配体计算(用于开发治疗癌症和老年痴呆症的新药)。此后,CUDA越来越受到人们的关注。Buck还说,他之前和很多行业的人交流过,发现他们宁愿牺牲性能也不愿意接受一门新的语言。为了给相关程序员提供良好的入门体验,便于CUDA的普及,CUDA采用了流行的C语言作为基础。

这样程序员就可以不用学习具体显示芯片或者特殊结构的指令就可以编写出运行在GPU上的程序,这无疑促进了CUDA在程序员中的普及。另外,当年英伟达做出的一个决定也是极其关键的。现任NVIDIA加速计算副总裁的Lan Buck回忆说,NVIDIA让自己的消费级GPU和高端产品支持CUDA。这意味着,只要研究人员和学生有笔记本电脑或台式机,他们就可以在学校实验室和宿舍开发软件。英伟达还说服许多大学开设课程,教学生使用他们公司的最新编程技术。程序员逐渐将GPU应用于气候建模、油气勘探等诸多领域。2012年,GPU强大的能力,加上深度学习,震惊了学术界。当时加拿大多伦多大学的杰弗里辛顿(Geoffrey Hinton)带着两个学生,用GPU训练深度神经网络,获得了ImageNet图像识别大赛的冠军。Buck说,在GPU出现之前,可能需要整整一个学期来训练这样的系统。有了这项技术,研究人员现在可以在很短的时间内完成这一过程。“我无法想象没有GPU我会做什么。”斯坦福大学副教授西尔维奥萨瓦雷塞说。对于GPU和英伟达来说,最好的时代已经到来。同样难以想象这个赌注是从零开始的。十亿美元的赌注

这绝对是赌上你所有的钱。关键决策者是英伟达的创始人黄仁勋。黄仁勋一直被国内网友称为“老黄”,甚至被贴上“核武器狂人、两弹之父”的标签,但本质上,他有着领袖乔一样的严谨个性和战略直觉。有些人习惯拿他和乔布斯比较。除了个性和才华,他们还喜欢穿深色衣服,甚至为公司建造引人注目的大楼。当然,改变英伟达命运的CUDA和改变苹果命运的iPhone有很多相似之处。至少他们俩同年出生,都是孤注一掷。当时老黄宣布要通过一系列的软件开发和修改工作,让GPU胜任各种任务,不再只是负责在屏幕上画图像。但是最大的问题是钱,钱,钱!他说:“对公司来说,成本极高。”一旦项目启动,CUDA的年R&D成本估计为5亿美元,而该公司的年总收入只有约30亿美元。换句话说,老黄把整个公司的1/6押在了一个看似与公司核心业务无关的软件平台上。最后,自从推出CUDA以来,NVIDIA已经投资了近100亿美元,将GPU转变为更通用的计算工具。无独有偶,就在黄仁勋重金押注CUDA的时候,计算行业正在发生广泛的变化,摩尔定律带来的计算提升速度正在放缓,这也让原本在芯片市场占据主导地位的英特尔动摇了自己的地位,即使很多芯片设计公司试图从零开始打造更专业的芯片,让这样的芯片与英特尔处理器一起运行,利用芯片电路的小型化来提供更多的收益。但是怎么才能阻止NVIDIA的潜在优势呢?在英特尔和其他芯片厂商的转型过程中,英伟达不需要从零开始。只要对现有的芯片进行重新定位,使用CUDA项目中开发的芯片和软件,就可以逐步构建一个受程序员和企业欢迎的技术平台。现在,这样的平台已经呈现在世人面前,但并不意味着战场风平浪静。芯片大战还在继续。英伟达的竞争对手说,在AI领域,芯片厂商之间的斗争才刚刚开始。首先,传统芯片巨头英特尔在这场战争中不甘落后。它先后收购了可编程芯片制造商Altera,其他专注于深度学习和机器视觉的初创公司,以及生产汽车驾驶辅助设备的以色列公司Mobileye。还有谷歌,其中最引人注目的是最近发布的第二代TPU,这是该公司内部开发的人工智能芯片。在它的帮助下,谷歌在围棋比赛中击败了世界冠军柯洁。谷歌声称这种芯片在某些应用上比GPU有明显的优势。当然,Wave Computing等初创公司也是这么说的。但是打败英伟达并不容易。一个很重要的原因是,这家公司有来自游戏市场的源源不断的收入,他们可以投资芯片研发,比大多数人工智能竞争对手都多。比如不久前发布的Volta架构,已经投入了30亿美元的研发费用,创下了行业纪录。英伟达表示,目前有超过50万开发者在使用GPU。此外,该公司还计划开放一种芯片架构,供其他芯片制造商免费用于灯泡和相机等低端深度学习应用,以扩大这些他们不打算涉足的领域的粉丝群。老黄说,“人工智能最终会影响到世界上的每一家公司,但我们不会面面俱到。”不了解黄仁勋的人认为这是谦虚,而了解他的人会知道,这是老黄敢赌敢赢24年战争背后的定力。