平臺描述
人工智能人才緊缺,供需比僅為1:10,但面向眾多學生的人工智能實驗卻難以開展。對此,AIRack人工智能實驗平臺提供了基于Docker容器集群技術開發的多人在線實驗環境。平臺基于深度學習計算集群,支持主流深度學習框架,方便快速部署訓練環境,同時支持多人在線實驗,并配套實驗手冊,同步解決人工智能實驗配置難度大、實驗入門難、缺乏實驗數據等難題,可用于深度學習模型訓練等教學、實踐應用。


平臺特性
在線實驗應用
一鍵部署深度學習計算環境,快速啟動訓練任務
支持多個人工智能實驗在線訓練
動態分配GPU資源,實現資源的合理共享
實時監控與掌握CPU/GPU資源使用情況及運行狀態
提供人工智能配套資源下載服務

實驗高效可靠
基于Docker容器技術,可瞬間創建隨時運行的實驗環境
使用幾臺機器即可虛擬出大量實驗集群,并配套GPU,滿足實驗室規模使用需求
采用Kubernetes容器編排架構管理集群,用戶實驗集群隔離、互不干擾
軟硬件高規格
硬件采用GPU+CPU混合架構,實現對數據的高性能并行處理
CPU選用英特爾E5-2600系列至強處理器,搭配英偉達多系列GPU
最大可提供每秒176萬億次的單精度計算能力
預裝CentOS和Ubuntu操作系統,集成Caffe、TensorFlow、PyTorch、Keras等主流深度學習框架

一站式服務
人工智能實驗平臺從實驗環境、教材PPT、實驗手冊、實驗數據、技術支持等多方面為人工智能課程提供一站式服務,大幅度降低人工智能課程學習門檻,滿足課程設計、課程上機實驗、實習實訓、科研訓練等多方面需求。

1.前沿教材PPT
平臺提供由清華大學博士、中國信息協會大數據分會副會長劉鵬教授主編的《深度學習》配套PPT。內容涉及人腦神經系統與深度學習、深度學習主流模型以及深度學習在圖像、語音、文本中的應用等豐富內容。

此外,還有10本正在籌備的書籍,也可為高校開展人工智能教學實驗提供相關幫助。

2.專業的實驗
配套包括116個人工智能相關的實驗,主要分別為四個模塊,每個模塊具體內容如下:
①基礎實驗:Linux基礎實驗,python基礎實驗,基本工具使用
?、跈C器學習實驗:常用機器學習Python庫,機器學習算法實驗
③深度學習基礎實驗:圖像處理,Caffe基礎使用,TensorFlow基礎使用,Keras基礎使用,PyTorch基礎使用。
④深度學習算法實驗:基礎實驗,進階實驗

3.豐富的數據
提供實驗代碼以及MNIST、CIFAR-10、ImageNet、CASIA WebFace、Pascal VOC、Sift Flow等訓練數據集
實驗數據做打包處理,為用戶提供便捷、可靠的人工智能和深度學習應用

平臺框架
AIRack人工智能實驗平臺整體設計基于Docker容器集群技術,可一鍵創建隨時運行的實驗環境:
1.Kubernetes是Google開源的容器集群管理系統,提供應用部署、維護、擴展機制等功能,利用Kubernetes能方便地管理跨機器運行容器化的應用。
2.實驗時,系統預先針對人工智能實驗內容構建好一系列基于CentOS7或Ubuntu的特定容器鏡像,通過Docker在集群主機內構建容器,為每個使用平臺的用戶開辟隔離的實驗環境。

平臺配置
管理服務器配置參數:
| 產品型號 | 詳細配置 | 單位 | 數量 |
| CPU | Xeon E5-2620 V4 | 顆 | 2 |
| 內存 | 32GB 內存 | 根 | 3 |
| SSD | 480GB SSD固態硬盤 | 塊 | 2 |
| 硬盤 | 240G固態硬盤 | 塊 | 1 |
| 企業硬盤 | 4TB 7.2K RPM 企業硬盤 | 塊 | 1 |
處理服務器配置參數:
| 產品型號 | 詳細配置 | 單位 | 數量 |
| CPU | Xeon E5-2650 V4 | 顆 | 2 |
| 內存 | 32GB 內存 | 根 | 8 |
| SSD | 480GB SSD固態硬盤 | 塊 | 2 |
| 硬盤 | 240G固態硬盤 | 塊 | 1 |
| GPU | GeForce RTX 2080 | 塊 | 8 |
支持同時上機人數與服務器數量:
| 上機人數 | 服務器數量 |
| 8人 | 1(管理服務器)+1(處理服務器) |
| 24人 | 1(管理服務器)+3(處理服務器) |
| 48人 | 1(管理服務器)+6(處理服務器) |
| 72人 | 1(管理服務器)+9(處理服務器) |
