MPU AI 芯片介绍之 Cambricon 寒武纪

关键字 :寒武紀CambriconMLU270MLU220AI

    大家好,今天我满分给大家带来的主题是 MPU AI 芯片介绍之 Cambricon 寒武纪。笔者运作过 MPU 芯片如 NXP i.MX,Rockchip 等,像寒武纪这样的 AI 芯片也是第一次接触,今天给大家分享最近的一些心得,内容比较粗浅,一起交流经验。


    1. Cambricon 寒武纪 公司介绍

    首先介绍一下寒武纪这家公司,以下内容百度公开资料所得,寒武纪成立于 2016 年,2020 年科创板上市,是中国领先的 AI 芯片公司,寒武纪聚焦云边端一体的智能新生态,致力打造各类智能云服务器、智能边缘设备、智能终端的核心处理器芯片,让机器更好地理解和服务人类。

    从官网可以看到其目前的产品类型集中、产品料号不多,相关信息可以参考如下图,官网直达链接在此(https://www.cambricon.com/)

    1 网站介绍



    2. Cambricon 寒武纪主推产品:MLU220 & MLU270

    目前寒武纪主推的 2 款产品分别是边缘计算端 MLU220,云端 MLU270,统一都是思元系列。现在的推广方式中,寒武纪的产品是以加速卡的形式提供给客户,接口类型为 M.2(MLU220)和 PCIe(MLU270),主要是方便硬件即插即用,便于客户上手,对于客户而言省去初始的硬件评估设计环节。接下来,我们再来具体看一看这 2 款产品的技术规格。

    2.1 MLU220

     2 MLU220

    上图为 MLU220 M.2 边缘加速卡的示意图,卡片上实现了 8TOPS(INT8)的算力,典型功耗仅为 8.25W。思元 220 M.2 边缘智能加速卡内置 4GB 的 LPDDR4X 内存容量,支持被动散热方式。用户可通过 M.2 标准 B+M Key 槽位快速部署到已有的业务中实现业务的智能升级和边缘加速解决方案。加速卡的硬件规格参考如下:

    3 MLU220 SPEC

    从硬件规格可以看出,MLU220 M.2 板卡小身材但是有大能量,值得一提的是 MLU220 芯片级能提供的算力可以到 16 TOPS。MLU220 拥有非常强悍的视频编解码能力:

  • 支持264 BP,H.264 MP,H.264 HP,H.264 High 10 Profile格式编解码
  • 支持HEVC (H.265) Main/Main 10 Profile格式编解码
  • 支持VP8/VP9 Profile 0解码
  • 编码性能:可以支持8X 1080P @30fps
  • 解码性能:可以支持16X 1080P@30fps

    在同一平台上,支持多个设备叠加使用,以扩展主机性能,适用于数据边缘节点的数据分析和推理应用。

    2.2 MLU270

    4 MLU270

    上图为 MLU270 智能加速卡的示意图,图中展示了 2 款,分别是带主动散热设计的 MLU270-F4 和 被动散热设计的 MLU270-S4。MLU270 采用了寒武纪全新的 MLUv02 架构,新架构提供 INT16,INT8,INT4,FP32,FP16 的全面 AI 精度支持,满足多样化神经网络的计算力要求,通用、性能兼备,最大支持的算力可达 128TOPS(INT8)。

    MLU270-S4 加速卡的硬件规格如下:



    5 MLU270 SPEC

    MLU270-S4 和 MLU270-F4 的差异主要是散热方式和形态规格,基本规格对比如下:

    6 MLU270 Benchmark

    从表格中可以看到,MLU270 的算力得到了巨幅提升,可以轻松搭载于最先进的人工智能服务器,实现 AI 推理计算力横向扩展。可广泛支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,帮助 AI 推理平台实现超高能效比。


    3. Cambricon 寒武纪产品应用

    这一节说一下寒武纪的产品应用,其实也可以理解为 AI 芯片的应用场景。在之前对于 AI 芯片有个固有印象就是这些产品都是居庙堂之高的,比较不接地气,但是了解之后发现,我们生活当中已经接触到非常多的 AI 芯片应用。寒武纪的产品面向的应用场景非常的丰富,比如智能制造、智慧农牧、智慧零售、智慧楼宇、智慧校园、智慧通信等,其中 MLU220 可大量应用于对数据处理有低时延,高安全需求的边缘场景,可实现数据的就近清洗、本地处理。同时按市场方向和算力匹配,可以参考下面图示:

     7 application

    4. 结语

    AI 芯片面对的场景应用很多,除了硬件支持,更多还需要软件算法模型的支持。目前针对 MLU220,MLU270,我们的技术团队已经完成服务器环境搭建,完成基于 Caffe、Tensorflow & Pytorch 的示例,如果您有相关的 AI 芯片需求,可以同我们联系交流,MLU220、MLU270加速卡也已经上架大大购平台,可以直接下单购买,非常的方便,直达链接如下:

    MLU220 M.2:https://www.wpgdadago.com/getAdDetailPage?AdId=554&Catg=C&ItemId=6283362&ParentId=

    MLU270-S4:https://www.wpgdadago.com/getAdDetailPage?AdId=555&Catg=C&ItemId=6283363&ParentId=

    MLU270-F4:https://www.wpgdadago.com/getAdDetailPage?AdId=556&Catg=C&ItemId=6283364&ParentId=

 

参考资料:

[1]寒武纪官网:https://www.cambricon.com/

[2]MLU220-M.2 边缘智能加速卡产品手册

[3]MLU270-S4 智能处理卡产品手册

★博文内容均由个人提供,与平台无关,如有违法或侵权,请与网站管理员联系。

★文明上网,请理性发言。内容一周内被举报5次,发文人进小黑屋喔~

评论