久久久久久久久久免费视频,国产精品电影在线,免费一看一级毛片,国产精品国产三级国产专,国产在线欧美精品,成人综合色站,欧美福利精品

浪潮發(fā)布支持TensorFlow的FPGA計算加速引擎TF2

TIME:2018-09-04
分享:

8月23日,在倫敦舉行的人工智能領(lǐng)域頂級會議KDD2018大會上,浪潮發(fā)布支持TensorFlow的FPGA計算加速引擎TF2,該產(chǎn)品可幫助AI客戶快速實現(xiàn)基于主流AI訓(xùn)練軟件和深度神經(jīng)網(wǎng)絡(luò)模型DNN的FPGA線上推理,并通過全球首創(chuàng)的FPGA上DNN的移位運算技術(shù)獲得AI應(yīng)用的高性能和低延遲。


目前,采用FPGA技術(shù)實現(xiàn)AI應(yīng)用的線上推理從而獲得可定制性、低延遲和高性能功耗比成為諸多AI公司采納的技術(shù)路線。但FPGA技術(shù)進入到大規(guī)模AI業(yè)務(wù)部署仍舊存在軟件編寫門檻高、性能優(yōu)化受限、功耗難以控制等諸多挑戰(zhàn)。浪潮此次發(fā)布的TF2計算加速引擎的目標就是期望為客戶解決在AI應(yīng)用FPGA技術(shù)的這些挑戰(zhàn)。

KDD18 浪潮展臺現(xiàn)場

TF2計算加速引擎由兩部分組成,第一部分是模型優(yōu)化轉(zhuǎn)換工具TF2 Transform Kit,它將經(jīng)過TensorFlow等框架訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)進行優(yōu)化轉(zhuǎn)換處理,大幅降低模型數(shù)據(jù)文件大小,如它可將32位浮點模型數(shù)據(jù)壓縮為4位整型數(shù)據(jù)模型,使得實際模型數(shù)據(jù)文件大小精簡到原來的1/8,并基本保持原始模型數(shù)據(jù)的規(guī)則存儲;第二部分是FPGA智能運行引擎TF2 Runtime Engine,它可實現(xiàn)將前述已優(yōu)化轉(zhuǎn)換的模型文件自動轉(zhuǎn)化為FPGA目標運行文件,為了消除深度神經(jīng)網(wǎng)絡(luò)如CNN等對FPGA的DSP浮點計算能力的依賴,浪潮創(chuàng)新設(shè)計了移位運算技術(shù),它可將32位浮點特征圖數(shù)據(jù)量化為8位整型數(shù)據(jù),并結(jié)合前述4位整型模型數(shù)據(jù),轉(zhuǎn)換卷積操作浮點乘法計算為8位整數(shù)移位運算,這將大幅提升FPGA做推理計算的性能并有效降低其實際運行功耗。這也是目前全球首次在基本保持原始模型計算精度的前提下在FPGA上實現(xiàn)深度神經(jīng)網(wǎng)絡(luò)DNN的移位運算。


TF2計算加速流程

在浪潮F10A FPGA卡上采用SqueezeNet模型對TF2計算加速引擎進行的測試表現(xiàn)出了非常好的計算性能。F10A是全球首款支持Arria 10芯片的半高半長的 FPGA加速卡。SqueezeNet是一種典型的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),模型精簡但其精度和AlexNet不相上下,特別適合于實時性要求較高的圖像類AI應(yīng)用場景。在F10A上運行經(jīng)過TF2引擎優(yōu)化加速的SqueezeNet模型,在基本保持原始精度的情況下,單張圖片的計算耗時為0.674ms,在計算精度和延遲方面均略優(yōu)于目前廣泛使用的GPU加速卡P4。


TF2 w/ F10A與GPU性能對比

浪潮TF2計算加速引擎通過移位運算、模型優(yōu)化等技術(shù)創(chuàng)新,提高了FPGA上AI計算性能,降低了FPGA的AI軟件實現(xiàn)門檻,將支持FPGA廣泛應(yīng)用于AI生態(tài)推動更多AI應(yīng)用落地。浪潮計劃將TF2開放給其人工智能客戶,并將持續(xù)升級開發(fā)支持多種模型優(yōu)化技術(shù)、最新深度神經(jīng)網(wǎng)絡(luò)模型以及采用最新芯片的FPGA加速卡,預(yù)計新一代高性能FPGA加速卡的性能將是F10A的三倍左右。

浪潮是全球領(lǐng)先的AI計算力廠商,從計算平臺、管理套件、框架優(yōu)化、應(yīng)用加速等四個層次致力于打造敏捷、高效、優(yōu)化的AI基礎(chǔ)設(shè)施。浪潮已成為百度、阿里和騰訊的最主要的AI服務(wù)器供應(yīng)商,并與科大訊飛、商湯、曠視、今日頭條、滴滴等人工智能領(lǐng)先科技公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助AI客戶在語音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級的應(yīng)用性能提升。據(jù)IDC《2017年中國AI基礎(chǔ)架構(gòu)市場調(diào)查報告》顯示,浪潮AI服務(wù)器市場份額達57%高居第一。

(文章來源:今日頭條)