寒武纪MLU-X1000智能加速器简介

背景介绍

       寒武纪(全称是中科寒武纪科技股份有限公司)是全球智能芯片领域的先行者,成立于2016年。寒武纪聚焦于云边端一体的智能新生态,致力打造各类智能云服务器、智能边缘设备、智能终端的核心处理器芯片,让机器更好地理解和服务人类。

       在寒武纪的产品研发历史中,1A/1H/1M等系列产品最早问世,其智能算法能耗比全面超越传统CPU、GPU,对视觉、语音、自然语言处理、传统机器学习等各类人工智能技术具备较好的普适性,同时性能功耗比传统芯片优势明显,可适应各种场景和规模的人工智能计算需求。

 

MLU-X1000

       MLU-X1000又称玄思1000智能加速器,是人工智能超算的构建单元。寒武纪玄思1000智能加速器整机在2U机箱内集成了4颗思元290智能芯片,提供高达2POPs的自适应精度算力,可实现AI算力多向扩展,满足性能、扩展性、灵活性、鲁棒性的要求。

       在面向多样化的人工智能算力中心,MLU-X1000采用寒武纪MLU-LINK片间直连技术,可以构建从4卡到16卡的超算系统,为人工智能算力中心提供高敏捷、高可靠、高性能的算力基础。可用于AI模型的训练和推理。

MLU-X1000智能加速器规格如下:

提示:如果需要MLU-X1000样机及SDK部署和测试,请联系技术支持工程师Barret:Barret.Bi@wpi-group.com

核心优势

  1. 『寒武纪MLUv02扩展架构

思元290基于MLUv02架构进行了多项扩展,实现峰值算力提升4倍、缓存带宽提高12倍、芯片间通讯带宽提高19倍。新架构采用7nm制程,可提供更高性能功耗比,以及多MLU系统的扩展能力。



  1. 寒武纪MLU-Link™多芯互联技术

MLU-Link™多芯互联技术,首发于寒武纪思元290芯片,总带宽高达600GB/s,支持思元芯片间互联和跨系统互联,可实现纵向扩展,满足AI模型训练的需要。

  1. 寒武纪vMLU虚拟化解决方案

寒武纪虚拟化技术vMLU,支持在思元290上实现4个相互隔离的AI计算实例,每个实例独占计算、内存和编解码资源,在虚拟化环境下仍可保持不低于90%的极高效率,帮助客户充分利用硬件资源。

  1. 寒武纪端云一体软件栈

寒武纪基础软件平台采用端云一体架构,支持寒武纪全系列产品共享同样的软件接口和完备生态,可方便地进行AI应用的开发,迁移和调优,轻松实现云端开发训练模型,终端部署应用。

  1. 自适应精度训练

思元290采用寒武纪自适应精度训练方法。自适应精度训练可自适应调整人工智能模型不同层、不同数据类型的量化参数,同时量化参数调整周期也是自适应的,可在保证精度要求的基础上提高能效比。

  1. 高带宽内存

思元290承载了32G高带宽内存(HBM2),单芯片内存带宽高达1.23TB/秒,是思元270芯片的 12倍,有效解决传统加速器芯片内存带宽瓶颈问题,为用户提供更高的模型训练速度。』

 

参考资料

https://www.cambricon.com/index.php?m=content&c=index&a=lists&catid=330

★博文内容参考自 网站,与平台无关,如有违法或侵权,请与网站管理员联系。

★文明上网,请理性发言。内容一周内被举报5次,发文人进小黑屋喔~

评论