简要概述
CNMon(Cambricon Neuware Monitor,寒武纪硬件监测器工具)是一款寒武纪硬件检测工具,通过调用CNDev接口获取底层硬件信息。CNMon不仅可以采集底层硬件信息,还可以实时获取上层软件对硬件资源的开销,为用户实时显示当前底层硬件的详细信息和状态。
运行环境及要求
A)运行环境:
Ubuntu 16.04(4.4.0‑112),Ubuntu 18.04(4.15.0‑32)
Debian 9.8(4.14.138),Debian 10.1(4.19.0‑6)
CentOS 7.4(3.10.0‑693),CentOS 7.6(3.10.0‑957)
B) 环境要求:
1)库依赖
MLU100驱动版本号高于或者等于3.5.0。
MLU270、MLU290、MLU370驱动版本号高于或者等于4.14.0。
在用户执行完安装步骤后,所有依赖库便会自动安装。
2)Docker环境
MLU100驱动用户需要手动添加容器运行参数 - -device /dev/cnmon_dev。
MLU270驱动用户需要手动添加容器运行参数 - -device /dev/cambricon_ctl。
如用户遇到窗口显示异常问题,可在容器运行时添加如下参数:
-e COLUMNS=85 –e LINES=54
85和54只是一个参考长度,可设置为更大数值,或直接拖动窗口亦可。
3)关于pid注意事项如下:
若在docker里面运行目标程序,并在该docker里面打开CNMon可以检测到该docker下的pid。
若在docker里面运行目标程序,并在另一个docker里面打开CNMon,则检测不到目标程序的pid。
若在host端运行目标程序,并在任意docker里面打开CNMon,则检测不到目标程序的pid。
在任意docker里面运行目标程序,则在host端可以检测到目标程序的pid。
4)注意事项
在CNMon使用期间,建议不要remove设备、不要将设备Passthrough到虚拟机,否则会运行出错。
安装使用
在正确安装driver包后,CNMon即安装成功。查看CNMon安装后信息,在终端输入 cnmon 命令,显示内容如下所示:(这里以MLU270-F4为例)
参考资料
《Cambricon-CNMON-User-Guide-CN-v1.19.0.pdf》
评论