861
魔獸
降低人工智能成本50%阿裏雲推出新一代異構實例GN5i
9月12日,阿裏雲正式推出最新一代GPU實例GN5i。這款產品主要適用於深度學習的在線推理(Inference)階段,可一鍵部署TensorFlow等主流深度學習框架,提供智能調度、自動運維、實時擴容等服務。人工智能產業用戶可通過GN5i搭建微秒級響應的AI服務,在線服務成本減少50%以上。
阿裏雲官網顯示,GN5i采用了英偉達Pascal架構P4圖形處理器,提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力,在滿足數據處理吞吐的基礎上,時延最低可達微秒級。支持小時付費,也支持包月包年。
此外,針對自建GPU服務器經常會遇到的擴容難、適配難的問題,GN5i規格族提供了靈活彈性的係列化配置,可以根據深度學習計算力的要求,按需選擇合適的規格,分鍾級即可完成實例的創建,並可根據運算力需求進行GPU實例的“Scale-out”水平擴容或“Scale-up”垂直變配。
阿裏雲高級技術專家龍欣介紹,在麵向AI深度學習在線推理場景時,GN5i實例能夠給客戶帶來以下價值:
• 穩定的企業級GPU計算能力,保障深度學習推理任務處理效率;
• 全麵兼容主流深度學習框架,如TensorFlow、Caffe、MXNet、CNTK等;
• 配備阿裏雲高性能SSD雲存儲,加速數據的讀取性能;搭配阿裏雲的OSS存儲服務,能達到最佳的存儲性價比;
• 在滿足數據處理吞吐的基礎上,時延最低可達微秒級;
• 推理型專用GPU,大幅降低AI在線服務建設成本;
• GN5i的推出進一步豐富了阿裏雲異構計算家族的產品線。針對模型訓練學習,阿裏雲在今年5月推出了高性能GPU實例GN5,單實例最多可提供8個英偉達 P100 GPU、2萬多個並行處理核心,最高75TFLOPS FP32單精度浮點、150 TFLOPS FP16半精度浮點和37 TFLOPS FP64雙精度浮點運算能力,每個P100搭配的16GB HBM2 3D堆疊內存提供了高達732GB每秒的數據傳輸速率,配合GN5i可有效保障深度學習的處理效率。
除了產品層麵,阿裏雲還提供了全方位的人工智能產業服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術服務,這些技術正通過阿裏雲ET對外輸出。過去一年,阿裏雲推出ET城市大腦、ET工業大腦、ET醫療大腦等行業垂直的人工智能係統,為工廠或者醫院創造更多利潤或者更高的診斷準確率。
最後更新:2017-09-13 10:03:11