Popular posts from this blog
被特斯拉嘲笑,英偉達放狠話要造超級AI晶片!
NVIDIA的數據中心業務最近一直處于虧損狀態,過去幾年每年大約翻一番。 它在2018財年達到了19.3億美元,比上一年增長了近130%。 這種增長主要是由于HPC中普遍使用NVIDIA GPU以及人工智能研究和開發的神經網絡培訓。 然而,常識說,在某些時候,運行AI應用程序的需求將變得比構建它們的需求更大(假設這些AI工具確實有用)。 考慮到這一點,現在有很多公司,無論大小,都在為推理處理設計晶片,包括Google,Intel,Wave Computing和Graph Core。 進入基于圖靈的Tesla T4和TensorRT 5軟件 當NVIDIA宣布圖靈GPU,定位可視化和實時渲染時,它包含了一些非常有趣的規格,表明它可以成為一個很好的推理引擎。行業觀察家們想知道NVIDIA GPU是否是引領這種向“生產AI”過渡的合適技術,因此對NVIDIA首席執行官Jensen Huang來說,展示公司在推理處理中的地位至關重要。令人失望的是,黃先生在GTC-Japan主題演講中宣布推出基于Turing的全新Tesla T4,這是該公司首款專門針對數據中心推理處理的GPU。 迄今為止,NVIDIA的推理平臺一直專注于機器人和自動駕駛,例如用于汽車的DrivePX中的Xavier SOC和用于機器人的Jetson。就數據中心的推理處理而言,NVIDIA表示其P4和P40 GPU在云中非常受AI歡迎 - 提供視頻,語音處理,運行電子商務推薦引擎的圖像識別,以及用于分析和翻譯的自然語言處理演講成文。NVIDIA共享的一個例子是微軟Bing,它使用這些GPU為其視覺搜索功能提供了比使用CPU快60倍的能力。此外,每個P4 GPU可以處理30個同步的視頻流,以每秒30幀的速度運行。 全新的NVIDIA Tesla T4 GPU將有效取代P4,并采用圖1所示的薄型PCIe封裝。新型晶片僅耗電75瓦,具有針對推理作業中流行的整數計算優化的320“Turing Tensorcores”。 它可以產生每秒130萬億的8位整數和260萬億次4位整數運算(或TOPS)。 如果您需要浮點運算,例如神經網絡訓練所需的,T4可以處理65 TFLOPS進行16位計算 - 大約是NVIDIA Volta GPU性能的一半,而功耗僅為1/4。 最終結果是處理前面提到的視頻流的速度提高了...
https://store.gravitylink.com
ReplyDelete