容器服務--如何在阿裏雲容器服務上運行基於TensorFlow的Alexnet
AlexNet是2012年由Alex Krizhevsky使用五層卷積、三層完全連接層開發的CNN網絡,並贏得了ImageNet競賽(ILSVRC)。AlexNet 證明了CNN在分類問題上的有效性(15.3%錯誤率),而此前的圖片識別錯誤率高達25%。這一網絡的出現對於計算機視覺在深度學習上的應用具有裏程碑意義。
AlexNet也是深度學習框架常用的性能指標工具,TensorFlow就提供的alexnet_benchmark.py可以測試GPU和CPU上的性能。我們嚐試基於AlexNet在阿裏雲容器服務上簡單快速地運行GPU應用,於是乎就寫了這個攻略。
前提條件
需要基於北京HPC或者GN4規格族GPU雲服務器的容器服務:
l 創建基於北京 HPC 的容器集群;
l 創建 GN4 型 GPU 雲服務器集群。
操作步驟
1、 登錄容器服務的管理控製台。
2、 單擊左側導航欄中的鏡像與模板>鏡像。
3、 在搜索框中輸入alexNet_benchmark並單擊全局搜索。
4、 單擊 registry.cn-beijing.aliyuncs.com/tensorflow-samples/alexnet_benchmark:1.0.0-devel-gpu右邊的創建應用。
5、 輸入應用名稱(本示例中為alexNet)並選擇北京HPC或者GN4規格族ECS集群, 單擊下一步。
6、 配置應用。
i 在基本配置中,單擊選擇鏡像版本,選擇鏡像版本為 1.0.0-devel-gpu。
ii 在容器配置中,填寫運行的命令行,比如python /alexnet_benchmark.py --batch_size 128 --num_batches 100。
iii 在標簽中,填寫阿裏雲gpu標簽,標簽名為aliyun.gpu,標簽值為調度的GPU數量,本示例中為1。
7、 完成應用配置後,單擊創建創建應用。 可以在應用列表頁麵,查看創建的alexNet應用。
這樣就可以在管理控製台,直接通過容器日誌服務查看AlexNet在EGS或者HPC上的性能。
操作路徑:在應用列表頁麵,單擊應用名稱alexNet >單擊容器列表頁簽>單擊容器右邊的日誌。
最後更新:2017-07-20 11:03:06