您現在的位置是:首 頁 > 高性能資訊 >


      在線咨詢
       

      深度學習服務器--LINKZOL基于8個GTX1080Ti的GPU計算服務器性能測試

          LINKZOL品牌(聯眾集群公司)通過和全球視覺計算領域的領導者NVIDIA公司的緊密合作,并與NVIDIA建立了NPN網絡合作伙伴關系,通過近十年與高校和科研院的合作經驗,將產品類型深度開發。相繼推出LZ-743GR-2G/Q,LZ-748GT,LZ-428GR-8G等深度學習應用的專用GPU計算服務器和工作站,例如在2U整機實現容納6個NVIDIA Tesla K80,P40,P100/TITANX/GTX 1080Ti,以及在4U整理容納4個和8個NVIDIA Tesla K80,P40,P100/Titanx(pascal)/GTX 1080Ti的GPU計算卡,利用NVIDIA的CUDA生態系統,CUDNN等GPU加速庫,實現“CPU+GPU”協同計算加速,合理分配計算資源,充分釋放計算能力,以高效,可靠,穩定的特性,滿足不同行業的深度學習和人工智能等的計算應用。同時利用GNU編譯器包括C/C++/Fortran,MKL庫以及利用OPENMPI和MPICH的并行消息環境,采用Caffe,Tensorflow,Theano,BIDMach,Torch等深度學習框架,通過編譯Caffe的Python和Matla等接口,基于B/S架構實現且可視化的進行DNN的訓練,測試等。

        測試平臺:

        LINKZOL品牌8個GPU深度學習服務器,型號:LZ-428GR-8G

        系統環境:Ubuntu 16.04 LTS

        編譯器:GNU編譯器,包括C/C++/Fortran編譯器;Intel編譯器,C/C++/Fortran編譯器、MKL、MPI等;

        并行環境:配置OpenMP并行環境;GPU開發環境:配置最新CUDA驅動、編譯器、調試器、SDK及例子文件等;

        支持cuDNN加速,CUDA FFT、CUDA BLAS等;深度學習框架:預裝Caffe, Torch, Theano, BIDMach、TensorFlow

        測試配置:

        2顆十核E5-2630V4(2.2GHZ,8.0GT/S),64G(16G*4)DDR4 2133MHZ內存,1片512G 企業級SSD,1片2T企業級硬盤,8個GTX 1080Ti(CUDA核心數3584,11G DDR5顯存)。

          備注:安裝和調試步驟在此不描述;測試機型見圖(2)

      (圖2)

      //通過以下命令可見系統有8塊GPU卡

      lzhpc@ubuntu:~$ nvidia-smi

      Mon Apr 24 22:21:32 2017

      +-----------------------------------------------------------------------------+

      | NVIDIA-SMI 378.13                 Driver Version: 378.13                    |

      |-------------------------------+----------------------+----------------------+

      | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |

      | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |

      |===============================+======================+======================|

      |   0  Graphics Device     Off  | 0000:04:00.0     Off |                  N/A |

      | 23%   34C    P0    59W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   1  Graphics Device     Off  | 0000:05:00.0     Off |                  N/A |

      | 23%   35C    P0    60W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   2  Graphics Device     Off  | 0000:08:00.0     Off |                  N/A |

      | 23%   33C    P0    60W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   3  Graphics Device     Off  | 0000:09:00.0     Off |                  N/A |

      | 23%   31C    P0    60W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   4  Graphics Device     Off  | 0000:84:00.0     Off |                  N/A |

      | 23%   33C    P0    59W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   5  Graphics Device     Off  | 0000:85:00.0     Off |                  N/A |

      | 23%   36C    P0    59W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   6  Graphics Device     Off  | 0000:88:00.0     Off |                  N/A |

      | 23%   31C    P0    59W / 250W |      0MiB / 11172MiB |      0%      Default |

      +-------------------------------+----------------------+----------------------+

      |   7  Graphics Device     Off  | 0000:89:00.0     Off |                  N/A |

      | 23%   37C    P0    61W / 250W |      0MiB / 11172MiB |      2%      Default |

      +-------------------------------+----------------------+----------------------+

      測試方法:

      使用矩陣乘算例分別測試8塊GPU卡,在同一計算量下的計算時間對比!

      測試命令如下:./matrixMul  gpu_num  loop_num

      其中,gpu_num指定使用幾塊GPU卡計算,loop_num指定計算量,因為這里最大8塊GPU卡,所以loop_num測試取值可為8!gpu_num的取值分別為8,進行測試如下:

      //使用8塊GPU卡進行測試,用時0m20.487s

      lzhpc@ubuntu:~$ time ./matrixMul  8  8

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[0]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[2]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[7]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[4]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[5]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[6]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[3]:"Graphics Device"  with compute capability 6.1

      MatrixA(3200,3200)*MatrixB(3200,3200) Using GPU[1]:"Graphics Device"  with compute capability 6.1

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Computing CUDA Kernel...

      Time= 7243.66 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7246.23 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7255.54 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7293.25 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7298.95 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7312.67 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7314.78 msec for one loop (two hundreds of matrinx*matrix)

      Time= 7318.51 msec for one loop (two hundreds of matrinx*matrix)

      main time:17897.691 seconds

       

      real    0m20.487s

      user    1m4.904s

      sys     0m16.712s

      如需了解更多產品,可通過LINKZOL官方網站進行了解

      或者撥打400-630-7530進行咨詢了解

       

       
      首 頁 | 深度學習 | 計算服務器 | 高性能資訊 | 解決方案 | 支持下載 | 關于我們
      全國免費24小時熱線: 400-630-7530 手機:13810114665 傳真:010-57324973
      郵箱:sales@www.omtaexpo.com
      京ICP備19051987號
      Copyright © 2019 All rights reserved www.omtaexpo.com 設計維護:時代中廣傳媒  網站管理
      欧美人与动人物一级a片_欧美人与动人物在线_欧美人与动牲交a欧美精品_欧美人与动牲交欧美精品