雷鋒網按,本文分析了目前AI芯片市場的情況,以及NVIDIA在這一市場的領先地位。不過,隨著芯片巨頭在AI芯片領域有了新的進展,NVIDIA將會面臨更多的挑戰(zhàn),2019年AI芯片市場會如何?
作者將會分三部分進行介紹,本文是第一部分。
NVIDIA的領先優(yōu)勢
過去的五年,NVIDIA在數(shù)據(jù)中心領域成為了規(guī)模數(shù)十億美元的巨頭,并且沒有一次面對持續(xù)且非常強勁的對手,這是一個令人驚訝的事實。NVIDIA快速增長的動力來自人工智能(AI)和高性能計算(HPC)對GPU芯片的需求。NVIDIA首席執(zhí)行官Jensen Huang喜歡談論深度學習的“寒武紀爆炸”,指的是神經網絡算法的快速迭代。
目前,我們處于AI芯片爆發(fā)的門口,全球許多大型和小型公司都加入其中。三年前,芯片創(chuàng)業(yè)公司幾乎不可能獲得風險投資,現(xiàn)在,有數(shù)十家資金充足的挑戰(zhàn)者在研發(fā)AI芯片。
去年,NVIDIA和 IBM為世界上最快的超級計算機提供芯片(據(jù)稱其中95%的性能歸功于NVIDIA的Volta GPU)。雖然這是一項令人難以置信的成就,但許多人開始懷疑NVIDIA的輝煌能否持續(xù)。

在最新報告季度,NVIDIA數(shù)據(jù)中心收入同比增長58%至7.92億美元,占公司總收入的近25%。過去的四個季度總營收達到28.6億美元。如果能夠保持這種增長趨勢,2019年數(shù)據(jù)中心營收或達到約45億美元。
毫無疑問,NVIDIA以其強大的可擴展架構為動力打造出受歡迎的產品。NVIDIA現(xiàn)在擁有一個強大且持續(xù)更新的軟件,高校、初創(chuàng)公司和合作伙伴使其成為由其新創(chuàng)建的生態(tài)的主導者。有些人會認為這個生態(tài)系統(tǒng)是堅固的護城河,但暴風云正在出現(xiàn)。潛在的威脅來自英特爾,谷歌,AMD以及數(shù)十家美國和中國的初創(chuàng)公司。
目前為止,在我看來,大部分競爭者都“火力不足”。因為我非常有信心除了谷歌,其它挑戰(zhàn)者都沒有搶奪了NVIDIA的市場份額。讓我們來看看目前的競爭格局,2019年將會變得非常有趣。
重磅的競爭者
根據(jù)紐約時報的統(tǒng)計,有超過40家創(chuàng)業(yè)公司進入AI芯片領域,但實際情況是,只有少數(shù)公司能在這個市場上取得真正的成功(比如收入超過10億美元)。對于深度神經網絡(DNN)的訓練,鑒于其產品的實力,市場占有率和生態(tài)系統(tǒng),NVIDIA難以被擊敗。然而,目前市場規(guī)模還小的推理芯片市場最終將超過訓練市場。
與訓練不同,推理不是單一的市場。推理包含了云端和終端,每一種應用對深度學習算法、性能、功耗和延遲都有特定的要求。另外,在推理市場還沒有絕對的領導者,即便NVIDIA聲稱在汽車市場擁有領導地位。
出于這些原因,推斷市場是大多數(shù)新進入者主要或最初關注的方向。讓我們來看看重磅的競爭者。
谷歌
谷歌是最早推出專用芯片(ASIC)的公司之一,然而谷歌可能是NVIDIA最大的客戶之一。谷歌的“Tensor Processing Units”(TPU)芯片已經更新至第三代,可以加速云端的深度學習訓練,最近還可以加速推理處理。據(jù)悉,用于訓練和處理DNN的Google TPU的性能相當穩(wěn)定,單芯片每秒性能可達45 TOPS。相比之下,NVIDIA的Volta性能最高可達125 TOPS。第一批TPU只供內部使用,現(xiàn)在谷歌將它們作為服務提供給Google Compute Cloud的客戶。
雖然TPU會對谷歌的人工智能的發(fā)展產生影響,但除了內部的,對外的服務(這是一個相當大的市場)是故意限制的。TPU只能用于培訓和運行Google TensorFlow框架,無法使用它來訓練或運行使用Apache MxNet或PyTorch構建的AI,PyTorch框架的重要推動者是Facebook 和微軟。TPU也不能用于非AI HPC應用,這一領域GPU占據(jù)絕對主導地位。
此外,TPU也不向企業(yè)或政府的數(shù)據(jù)中心出售。但谷歌對此表示滿意,因為它將TPU和TensorFlow視為其全面的AI領導力戰(zhàn)略。針對硬件的軟件優(yōu)化,可以構建強大而耐用的平臺。
TPU更直接的影響可能是驗證ASIC可以作為GPU的替代品,至少對潛在投資者而言如此。深度學習芯片初創(chuàng)公司的首席執(zhí)行官表示,一旦谷歌宣布其TPU,風險資本就開始尋找投資目標,他隨后獲得了數(shù)億美元投資。
谷歌一直擅長從NVIDIA的GPU技術大會(通常在三月份)的可預測信息中竊取一些引人注意的信息,如果今年谷歌發(fā)布性能強大的7nm TPU,對比我不會感到驚訝。
亞馬遜也在去年秋天宣布,正在為推理處理研發(fā)ASIC。但是,該芯片仍在開發(fā)中。

英特爾
英特爾是非常重磅的玩家,雖然該公司打算使用Nervana芯片在2019年參與人工智能訓練和推理的競爭,但它意識到推理將是更大的市場,并且擁有非常強大的實力。
除了Xeon CPU(最近更新后,推理性能得到顯著提升),該公司還分別收購了MobileEye和Movidius,用于汽車和嵌入式推理。我已經看過這兩種設備的演示,它們的確令人印象深刻。英特爾還推出了OpenVino軟件工具包,它允許開發(fā)人員在任何地方進行訓練,然后在英特爾處理器上進行優(yōu)化和運行。
CES 2019上,英特爾透露正在與Facebook密切合作準備推出Nervana神經網絡處理器(NNP-I),因為許多人猜測Facebook正在開發(fā)自己AI加速器。與此同時,英特爾副總裁兼AI產品總經理Naveen Rao在 Twitter上分享,NNP-I是采用英特爾10nm的SoC,并采用IceLake x86內核。
對于訓練,英特爾最初的計劃在收購Nervana一年的2017年宣布“Lake Crest”Nervana NNP。之后推遲到2018年,然后,公司決定重新開始。這可能是因為英特爾意識到第一款Nervana設備不足以大幅超越NVIDIA。
高通和蘋果
為了完整性,我將高通和蘋果也包括在內,因為它們都提供了令人印象深刻的手機人工智能功能(高通也布局IoT和自動駕駛汽車)。蘋果專注于iPhone A系列CPU和用于手機AI的iOS操作系統(tǒng)支持。隨著移動平臺成為語音和圖像AI推理的主要平臺,這兩個玩家擁有大量可用于建立領導力的IP(盡管華為我們也非常努力地推動人工智能。)
AMD
過去三年,AMD一直在努力讓AI的軟件正常運轉。當我2015年在那里工作時,如果沒有啟動Windows,你甚至無法在Linux服務器上運行GPU。從那時起,AMD進行了很多工作,ROCm軟件和編譯器簡化了CUDA的遷移,并且在其芯片上加速數(shù)學庫MlOpen(不要與OpenML混淆)。然而,目前AMD的GPU仍然至少落后NVIDIA V100產品一代,而V100推出已經接近兩年了。
AMD是否有能力在7nm上與NVIDIA TensorCores競爭,還有待觀察。AMD可能會決定更多地關注推理市場,可能推出自動駕駛汽車平臺,類似NVIDIA Xavier SoC,時間會證明。
賽靈思
Xilinx 的FPGA在2018年表現(xiàn)出色,除了宣布其7nm的下一代架構外,還與微軟、百度 、亞馬遜、阿里巴巴、戴姆勒-奔馳等合作伙伴達成合作。在AI推理中,F(xiàn)PGA具有優(yōu)于ASIC的優(yōu)勢,因為FPGA可以針對特定的應用進行即時重新配置。當基礎技術快速變化時,這很重要,就像AI一樣。
例如,微軟展示了其FPGA(來自賽靈思和英特爾)如何在深度神經網絡中對特定層,可以使用1bit,3bit或其它精度的數(shù)據(jù)。這可以大大加快處理速度,并減少延遲,同時降低功率。此外,即將推出的Xilinx 7nm芯片稱為Versal,具有AI和DSP引擎,可加速特定應用程序處理以及自適應邏輯陣列。Versal將在今年的某個時候開出貨,我認為這可能是推理處理的改變者。