深度學習解決方案

秒建工作環境

Matrix Fusion在雲端預安裝主流深度學習框架、數據科學資料庫和GPU驅動,用(yòng)戶無需耗費時間搭建開發(fā/fà)環境,可(kě)在一分鍾内通過(guò)簡單的鼠标點擊完成開發(fā/fà)環境設置,可(kě)以迅速靈活調用(yòng)CPU和GPU資源。



智能(néng)化資源調度

Matrix Fusion 支持各類硬件及操作系統,提供端到端的基礎設施軟件解決方案,管理基礎CPU和GPU計算資源,能(néng)夠自(zì)動進行(háng / xíng)工作負載資源調配。深度學習是同時利用(yòng)CPU和GPU處理工作負載的典型應用(yòng),Matrix Fusion通過(guò)整合用(yòng)戶所(suǒ)有的硬件資源(集群亦或是單機)成爲CPU+GPU資源池,再将資源根據開發(fā/fà)者需要(yào / yāo)重新分配CPU和GPU到開發(fā/fà)者的虛拟環境下(xià),管理員也可(kě)以将多餘的計算資源靈活分配給其(qí)他用(yòng)戶或更爲嚴苛的工作負載。



用(yòng)戶在不同的虛拟環境中可(kě)以選擇在CPU資源上開發(fā/fà),然後(hòu)在GPU資源中測試,需要(yào / yāo)擴展訓練到更多GPU上時,可(kě)立即調用(yòng)虛拟環境中任意數量的GPU資源。



容器管理

Matrix Fusion 構建于(yú)強大的計算硬件和GPU虛拟化的基礎上,搭載了全方位的容器管理方案。核心負載引擎容器化,是作爲極大簡化深度學習和AI工作流程的最新技術,在金錢、人力、時間上投資不菲。而(ér)Matrix Fusion無需進行(háng / xíng)個性化調整,用(yòng)戶隻需登錄操作界面,就(jiù)可(kě)以直接調用(yòng)專業化容器解決方案。 Matrix Fusion容器管理層包括1個内置資源庫,可(kě)以管理預配置容器(包括了每一種部署場景或個性化生(shēng)成容器): 預配置環境:Matrix Fusion預配置最新的深度學習框架和數據科學數據庫,用(yòng)戶可(kě)以直接使用(yòng)TensorFlow、Caffe、Torch以及其(qí)他社區的最新技術版本。 DIY開發(fā/fà)環境:用(yòng)戶可(kě)以利用(yòng)“工作區快照”或“調入容器”來修改并保存容器環境,DIY一個更貼合自(zì)己使用(yòng)習慣的開發(fā/fà)環境。Matrix Fusion “調入容器”可(kě)以爲用(yòng)戶提供一個簡約的容器(僅含操作系統、最低配置的數據庫和驅動要(yào / yāo)求),用(yòng)戶自(zì)行(háng / xíng)修改環境,然後(hòu)上載作爲标準環境進行(háng / xíng)後(hòu)續開發(fā/fà)。 用(yòng)戶可(kě)以通過(guò)“工作區快照”利用(yòng)“Docker保存”工作流程來複制環境,修改後(hòu)保存到資源庫中,以便于(yú)下(xià)一次的開發(fā/fà)工作。 容器導出:容器可(kě)導出,作爲推理或其(qí)他生(shēng)産部署要(yào / yāo)求用(yòng)。



Fusion Core

Matrix Fusion強大的靈活性來源于(yú)Fusion Core計算虛拟化引擎。Fusion Core控制應用(yòng)和基礎GPU計算之間的API調用(yòng)指示,允許GPU負載靈活分布于(yú)本地GPU内存、網絡附加GPU、擴展至高達64個GPU,提供強大的整體性能(néng)。



因爲Fusion Core采用(yòng)的是“透明”模式而(ér)非虛拟層或其(qí)他虛拟化方式,所(suǒ)以不需要(yào / yāo)對(duì)基礎硬件或虛拟機環境做任何改變,也不需要(yào / yāo)改變應用(yòng)編程本身。這意味着(zhe/zhuó/zhāo/zháo)AI開發(fā/fà)者和數據科學家(jiā)可(kě)以無縫利用(yòng)GPU虛拟化的優勢,且将成本和集成需求降至最低。



數據卷

深度學習和AI工作負載所(suǒ)需數據通常來源廣泛,既有線上也有線下(xià),既有外部也有内部,既有批量文件也有文件系統等等。Matrix Fusion能(néng)夠簡化處理工作數據,讓管理員明确網絡附加存儲位置并映射到容器中。隻要(yào / yāo)主機能(néng)夠訪問數據地址,容器就(jiù)可(kě)以訪問數據,這讓AI開發(fā/fà)者和數據科學家(jiā)的工作大幅簡化. 此外,系統還支持靈活、無限制的數據映射,Matrix Fusion支持每個節點的本地NFS文件系統。這一默認選項提供了工作負載的标準地址,無論運行(háng / xíng)多大的深度學習工作負載(包括運行(háng / xíng)在多服務器之間的),都可(kě)以快速獲取運行(háng / xíng)任務所(suǒ)需的數據