2018年06月25日17:21 來源:移動通信網(wǎng)T|T
【移動通信網(wǎng)】在計算機視覺與模式識別(CVPR)大會上,NVIDIA宣布推出全新的數(shù)據(jù)增強庫和圖像解碼庫。
種VIDIADALI:GPU加速的數(shù)據(jù)增強和圖像加載庫,可優(yōu)化深度學習框架的數(shù)據(jù)管道
種VIDIAnvJPEG:用于JPEG解碼的高性能GPU加速庫
基于深度學習的計算機視覺應用程序包括復雜的多階段預處理數(shù)據(jù)管道,該管道包括諸多計算密集型步驟,如:從磁盤加載和提取數(shù)據(jù)、解碼、裁剪和調(diào)整大小、上色、空間轉(zhuǎn)換和格式轉(zhuǎn)換。
利用GPU加速數(shù)據(jù)增強,NVIDIADALI解決了當今計算機視覺深度學習應用的性能瓶頸問題,這些應用程序一般會包括復雜的多階段數(shù)據(jù)增強步驟。借助DALI,深度學習研究人員可以在圖像分類模型上擴展訓練性能,如:具備MXNet的ResNet-50、TensorFlow、適用于所有AmazonWebServicesP38GPU實例的PyTorch或帶有VoltaGPU的DGX-1系統(tǒng)。得益于各框架之間一致的高性能數(shù)據(jù)加載和增強,框架用戶將大大減少代碼重復的情況。
DALI依靠全新的NVIDIAnvJPEG庫進行高性能的GPU加速解碼。nvJPEG支持單一與批量圖像的解碼、顏色空間轉(zhuǎn)換、多相位解碼以及采用CPU和GPU的混合解碼。與僅通過CPU的解碼相比,采用nvJPEG解碼的應用具有更高的吞吐量和更低的延遲率。
DALI的優(yōu)勢包括:
紡芄揮朊嫦騇xNet、TensorFlow和PyTorch的直接插件輕松實現(xiàn)框架整合
繁閾腳嘌倒ぷ髁鞒討С侄嘀質(zhì)莞袷劍紓篔PEG、原始格式、LMDB、RecordIO和TFRecord
反鋅膳渲猛夾魏妥遠ㄒ宀僮鞣畝ㄖ剖莨艿?/p>
防胣vJPEG的高性能單一與批量JPEG解碼
nvJPEG優(yōu)勢包括:
凡捎肅PU和GPU混合解碼
返ヒ煌枷窈團客枷窠飴?/p>
費丈占渥恢罵GB、BGR、RGBI、BGRI和YUV
返ヒ緩投嘟錐謂飴?/p>
DALI為開源設計,現(xiàn)已可從GitHub上獲得。