Antoum 芯片

墨芯独创双稀疏化算法技术,重新定义AI芯片架构。第一款双稀疏化芯片Antoum针对云端人工智能推理场景,Antoum芯片支持高达32倍稀疏率。

Antoum是一款高性能通用可编程芯片,广泛支持CNN、RNN、LSTM、Transformer、BERT等网络模型和浮点、定点丰富的数据类型。

在视觉应用场景中,Antoum带来突破性的创新,将编解码性能提升至业内领先水平。Antoum的出现为现有AI芯片架构带来创新和更多算力提升空间。

Antoum 芯片独特优势

  • 超高算力

    通过优化计算模式,支持全面稀疏化神经网络,Antoum芯片提供超高算力。

  • 超低功耗

    墨芯Antoum芯片将同等运算量的耗电量降至1/10,以大大降低能耗成本。

  • 高能效比

    对多种常用的AI模型通用性优异,相比当前主流产品有10倍以上的能耗比提升潜力。

  • 高性能视频处理

    专用硬件转码引擎,可以解码多路全高清视频流,轻松地将可扩展的深度学习集成到视频处理中,以提供创新的智能视频服务。

AI加速卡

墨芯人工智能AI加速卡基于Antoum高效芯片,通过优化计算模式,支持全面稀疏化神经网络开发,为超高算力、超低功耗的通用AI推理加速卡。

墨芯AI推理加速卡支持多模型,适用于诸多深度学习模型的大规模推理场景,拥有自主可控的高性能计算IP核和系统架构和10余项人工智能和芯片设计领域的全球专利。

  • 生态兼容

    业界标准的软件API支持垂直类行业应用开发,支持TensorFlow、PyTorch、MXNET 等主流深度学习开发框架。

  • 通用性强

    广泛支持业内流行的诸多深度学习模型,如ResNet-50/101、Inception、MobileNet、EfficiencyNet、YOLO、BERT、Transformer。

  • 易用性高

    一键部署;工具链完善且简单易用,客户迁移成本低,快速获得稀疏加速。

  • TCO优化

    随着墨芯加速产品的算力极大提升,将用户的算力总成本 (TCO) 大幅降低。

云计算视觉搜索引擎

视觉搜索引擎介绍

现代视觉搜索技术使用AI来理解内容和照片的语境,并反馈相关结果列表。

墨芯为人脸识别和视觉搜索提供了一种突破性的视觉搜索服务应用场景架构,该架构基于FPGA稀疏处理,广泛应用于监控安防、智慧零售、社交媒体和自动驾驶等领域。

通过软硬件协同优化,墨芯AI引擎和Xilinx FPGA可以提供比GPU功耗更低、成本更低的大数据库低延迟视觉搜索。

墨芯的方法通过减少对OPS的需求和更小的网络规模 (存储) 来提高效率,与基于GPU的应用场景相比,其成本降低了15倍。

云计算视觉搜索引擎部署

通过软硬件的协同优化,墨芯可以提供低功耗、低成本的替代方案,在大型数据库上进行低延迟的视觉搜索。

VSaaS方案可部署于公有云 (如AWS F1、Alibaba F3)

高级,兼容的工具链和SDK集成了现有的工作流,允许高级优化

兼容ML框架,包括:TensorFlow, PyTorch, ONNX框架

联系墨芯访问可视化搜索Amazon机器实例,获得免费的14天试用:info@moffett.ai

点击浏览

资源

更多资源
请浏览资料中心

点击浏览

视频演示:基于AMI的亚马逊市场的墨芯视觉搜索F1