Antoum 芯片

墨芯独创双稀疏化算法技术，重新定义AI芯片架构。第一款双稀疏化芯片Antoum针对云端人工智能推理场景，Antoum芯片支持高达32倍稀疏率。

Antoum是一款高性能通用可编程芯片，广泛支持CNN、RNN、LSTM、Transformer、BERT等网络模型和浮点、定点丰富的数据类型。

在视觉应用场景中，Antoum带来突破性的创新，将编解码性能提升至业内领先水平。Antoum的出现为现有AI芯片架构带来创新和更多算力提升空间。

Antoum 芯片独特优势

超高算力

通过优化计算模式，支持全面稀疏化神经网络，Antoum芯片提供超高算力。

超低功耗

墨芯Antoum芯片将同等运算量的耗电量降至1/10，以大大降低能耗成本。

高能效比

对多种常用的AI模型通用性优异，相比当前主流产品有10倍以上的能耗比提升潜力。

高性能视频处理

专用硬件转码引擎，可以解码多路全高清视频流，轻松地将可扩展的深度学习集成到视频处理中，以提供创新的智能视频服务。

AI计算卡

墨芯人工智能AI计算卡S4、S10和S30，搭载墨芯Antoum®️芯片，支持高达32倍稀疏率，提供超高算力、超低功耗和超高能效比的AI计算加速。

墨芯人工智能AI计算卡，支持计算机视觉、自然语言处理、多模态等众多数据中心AI推理应用，适用于互联网、运营商、智慧城市、生命科学、自动驾驶等大规模推理场景，独创双稀疏算法技术和软硬协同架构设计，算力实现数量级提升，并为客户极大降低TCO。

软硬件协同设计

实现高性能和高能效，芯片计算单元和大容量大带宽片上存储紧密耦合，结合模型压缩稀疏能力，计算效率在业界处于领先位置。

高倍率稀疏张量核

支持高倍率稀疏张量运算的AI推理卡，支持高达32倍稀疏率，同时实现稀疏神经网络的高模型精度和高硬件执行效率。

可扩展性

通过自定义稀疏处理单元和专用视频编解码器、JPEG解码器引擎、词向量查找单元、内存格式转换引擎、向量处理器形成稀疏处理子系统，可灵活地支持并行模型和并行数据计。

高性能多媒体处理能力

集成专用硬件视频编解码器引擎和JPEG解码器引擎。支持智能视频分析服务，可轻松集成可扩展的深度学习算法，配备视频编解码器引擎可编解码4K多路视频流数据，配备JPEG解码器可以极大减轻CPU密集型的JPEG解码任务。

大模型方案

大模型方案介绍

随着前沿的AI大模型参数呈指数级增长的发展趋势下，仅凭一张或多张GPU计算卡已经很难满足大模型的推理需求。随之而来的，是企业采购、开发、运营成本的大幅增加。

墨芯提供了一种突破性的大模型推理引擎，广泛应用于计算机视觉、自然语言处理、音频处理等场景。

通过软件、硬件、双稀疏算法协同的设计方案，与基于GPU的设计方案相比较，实现单卡即可推理大模型，并且算力成倍数提高，为用户带来极低的延迟体验。

大模型推理引擎部署

利用SparseOPT工具，将稠密模型转化为对应的稀疏模型

利用SparseRT工具，对稀疏模型进行编译

利用SparseRT工具，将编译成功的稀疏模型做服务部署，并通过SOLA Runtime，为用户提供灵活便捷的硬件控制能力，助力开发复杂的AI应用

稀疏化算法重新定义AI计算

Antoum 芯片

Antoum 芯片独特优势

AI计算卡

墨芯AI加速卡在全球权威AI测评MLPerf中

连续两届获得冠军

大模型方案

大模型方案介绍

大模型推理引擎部署

更多资料
请浏览资料中心

点击浏览

稀疏化算法 重新定义AI计算

Antoum 芯片

Antoum 芯片独特优势

AI计算卡

墨芯AI加速卡在全球权威AI测评MLPerf中 连续两届获得冠军

大模型方案

大模型方案介绍

大模型推理引擎部署

更多资料请浏览资料中心

点击浏览

稀疏化算法重新定义AI计算

墨芯AI加速卡在全球权威AI测评MLPerf中

连续两届获得冠军

更多资料
请浏览资料中心