墨芯独创双稀疏化算法技术,重新定义AI芯片架构。第一款双稀疏化芯片Antoum针对云端人工智能推理场景,Antoum芯片支持高达32倍稀疏率。
Antoum是一款高性能通用可编程芯片,广泛支持CNN、RNN、LSTM、Transformer、BERT等网络模型和浮点、定点丰富的数据类型。
在视觉应用场景中,Antoum带来突破性的创新,将编解码性能提升至业内领先水平。Antoum的出现为现有AI芯片架构带来创新和更多算力提升空间。
墨芯人工智能AI计算卡S4、S10和S30,搭载墨芯Antoum®️芯片,支持高达32倍稀疏率,提供超高算力、超低功耗和超高能效比的AI计算加速。
墨芯人工智能AI计算卡,支持计算机视觉、自然语言处理、多模态等众多数据中心AI推理应用,适用于互联网、运营商、智慧城市、生命科学、自动驾驶等大规模推理场景,独创双稀疏算法技术和软硬协同架构设计,算力实现数量级提升,并为客户极大降低TCO。
随着前沿的AI大模型参数呈指数级增长的发展趋势下,仅凭一张或多张GPU计算卡已经很难满足大模型的推理需求。随之而来的,是企业采购、开发、运营成本的大幅增加。
墨芯提供了一种突破性的大模型推理引擎,广泛应用于计算机视觉、自然语言处理、音频处理等场景。
通过软件、硬件、双稀疏算法协同的设计方案,与基于GPU的设计方案相比较,实现单卡即可推理大模型,并且算力成倍数提高,为用户带来极低的延迟体验。
深圳 (总部)
地址:
深圳市南山区粤海街道微软科通大厦24D
电话:
0755-86700125
上海 |
地址:上海市徐汇区漕宝路650号
桂林高智科技大楼1号楼10层
北京 |
地址:北京市朝阳区融科望京中心
B座2202A
商务合作: sales@moffett.ai
媒体合作: marketing@moffett.ai
墨芯提供云端和终端AI芯片加速方案,相较于现有产品算力,墨芯产品将带来数量级提升。
Copyright © 2024
墨芯人工智能科技 (深圳) 有限公司
All rights reserved.
粤ICP备2021128059号