1.分析AI算法以及架构选择找到最优PPA(Power/performance/area)的软硬件设计;
2.与RTL Designer合作提供架构设计文档,并保证架构设计被正确实现;
3.研究机器学习算法和加速器的行业趋势和客户需求。
1.计算机电子相关专业硕士或博士学位
2.具有C ++ / python编程经验;
3.具有扎实的计算机体系结构基础;
4.具有硬件和RTL设计经验(Verilog /系统Verilog);
5.较强的沟通能力。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
研究和开发深度神经网络的推理加速方案,包括但不限于模型压缩、量化,高效的网络架构搜索,与各项场景应用的端到端加速方案。一些工作职责包括:
1.开发通用的模型压缩工具以及在调研最新的模型压缩与加速算法,在准确性和工具的易用性方面取得平衡与优化;
2.在最前沿的网络结构上测试模型加速方案并建立模型库;
3.与AI加速軟件工程师合作验证工具链在各个模型场景的有效性;
4.跟进与机器学习相关领域的研究趋势。
1.CS / EE /Math 硕士/博士;
2.有机器学习相关领域的研发经验,熟悉Tensorflow / PyTorch / MxNet等ML框架;
3.精通python / C / C ++编程;
4.于顶级AI/CV/NLP会议/期刊,CVPR/ICCV/ECCV/ACL/EMNLP/NAACL/NIPS/ICML/ICLR/KDD/AAAI/IJCAI 上的研究发表者为佳;
5.精通数值线性代数和优化知识者为佳;
6.具有CPU,GPU,计算机体系结构和加速器方面的经验为佳;
7.较强的沟通能力,领导能力和职业道德。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
1.解决公司大模型的系统、算法中的中长期难题;
2.系统难题包括但不限于:大规模LLM推理,Diffusion训练和推理;
3.算法难题包括但不限于:模型结构优化,优化器;算法与工程高度结合;
4.工作灵活,可以自由参与各种技术讨论,自己发现问题,并解决问题。
1.计算机、软件工程、人工智能等相关专业优先;
2.工程或机器学习算法有深厚的功底和经验;
3.由衷热爱技术,可以一线写代码,查问题;
4.历史上解决过难题,遇到难题时能静下心,没有畏难情绪,能查到底层,观察敏锐,逻辑清晰;
5.有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;
6.良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
加分项:
1.熟悉LLM、NLP、CV、语音相关的算法和技术,熟悉大模型训练、diffusion、RL算法者优先;
2.有以下某一方向领域的经验:CUDA,RDMA,AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),ML for System,Distributed Storage。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
开发将 Pytorch/vLLM 等 AI推理框架模型布署至 AI加速平台的模型优化算子库,一些工作职责包括:
1.开发转化、融合、拆解算子、以及分配资源的AI模型加速工具;
2.了解计算平台的指令集和体系结构,开发平台上的算子、并设计内存分配、执行顺序和分区的优化策略;
3.利用通用运算平台 (CPU/GPU) 开发算子/模型的运行库,模拟其在AI加速平台上的精度和性能;
4.制定测试计划和测试框架,以验证软件工具链的正确性和有效性。
5. 参与AI编译器的设计和开发,实现各种编译优化pass。
6. 参与编译器算子库开发,与编译器逻辑配合实现高性能计算。
1.计算机科学或相关领域的硕士/博士学位或同等学历;
2.熟练使用C / C ++ /Python 编程。在AI模型开发框架(如Tensorflow / PyTorch / MxNet)方面有经验; 对AI和深度学习算法有深入理解
3.了解常见AI模型算子的概念。具备类似 TensorRT / TVM / TF-Lite / MNN / NCNN / ARM-NN 等 AI 推理框架的经验者为佳;
4.具备 MLIR/ TVM / XLA / Glow / NGraph / LLVM之类的 AI 编译器方面的经验者为佳;
5.具有优化数值计算库(例如CUDNN / MKL)经验者为佳;
6.熟悉AI芯片架构/微架构为佳;
7.熟悉主流LLM serving(如vLLM,TensorRT-LLM)系统为佳;
8.较强的沟通能力,领导能力和职业道德。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
1.负责AI加速卡相关linux内核驱动、芯片固件的开发与维护
1.硕士及以上学历,计算机,电子类相关专业;
2.熟悉C/C++以及脚本开发;
3.熟悉linux内核驱动开发,并能跟据硬件及外设规范调试开发内核驱动;
4.有微控制器(MCU)和微处理器(如RISCV,ARM)的相关开发经验
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
1.负责软件栈SDK的开发和维护(类似NVIDIA软件栈)
2.负责模型的部署和优化(尤其是大模型,如GPT、ChatGLM、LLama)
3.负责模型推理框架的开发和维护
4.分析问题,解决问题,性能优化
1.熟悉C++和Python编程,熟悉Linux开发环境,具有良好的程序设计能力
2.熟悉计算机体系架构,如Linux、PCIe、NUMA等
3.熟悉NVIDIA软件栈如CUDA、TensorRT等
4.学习能力强,自我驱动力强,沟通能力好
加分项:
1.熟悉CUDA编程优先
2.熟悉主流推理框架优先,如TensorRT、Tengine等
3.熟悉LLMs的结构和算法
4.具有结合硬件的AI加速经验优先,如CPU(ARM/x86)、GPU(Mali/PowerVR/Adreno/Nvidia)等平台的高性能计算优化
5. 具有大型软件架构经验优先
6. 非常擅长榨干各种系统性能的优先
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
参与AI芯片上算子(Operators)的设计、开发和优化工作。
计算机科学、数学、电子工程或相关领域硕士及以上学历。
熟练掌握至少一种编程语言,如C/C++、Python等。
熟悉深度学习原理和至少一种深度学习框架(如TensorFlow、PyTorch、MXNet等)。
有良好的算法和数据结构基础,能够设计和实现高效的算法。
了解并行计算和GPU编程,熟悉CUDA或OpenCL者优先。
具备良好的团队合作精神、沟通能力和问题解决能力。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
1、与架构师及软件团队协作保证微架构及设计在多平台上被充分验证。
2、工作内容着重于设计验证基础平台的搭建。
3、使用System Verilog/UVM的方法针对设计功能制定验证计划。
4、日常维护回归测试以保证设计的正常工作。
1、要求CS/EE专业硕士或具有3年芯片验证相关工作经验的本科学历。
2、具有开发和执行复杂芯片测试计划的经验,熟练掌握System Verilog及Python/Perl等脚本语言。
3、精通UVM方法学,具有SOC级及IP子系统的验证经验,例如CPU子系统,PCIE,以太网,DDR和serdes系统等。
4、负责为复杂芯片定义/开发/执行自测试环境。
5、熟悉assertion和代码/功能覆盖率,熟悉形式验证工具。
6、良好的沟通能力,具备团队协作精神。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
参与AI编译器的设计和开发,实现各种编译优化pass。
参与编译器算子库开发,与编译器逻辑配合实现高性能计算。
要求:
计算机科学、电子工程等相关专业本科及以上学历。
5-10年相关领域工作经验, 深度参与过AI编译器的设计与开发。
精通编译原理,熟悉TVM, MLIR, LLVM等编译器框架。
精通C/C++,Python等编程语言。
熟悉AI芯片架构/微架构。
对AI和深度算法有深入理解。
熟悉深度学习框架(如TensorFlow、PyTorch),了解主流LLM serving(如vLLM,TensorRT-LLM)系统。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
职责描述:
1.负责深度学习模型在端/云上的部署和优化;
2.负责AI编译器工具链相关软件的研发,包括深度学习模型前端、编译器、后端算子实现、高性能优化等;
3.构建易用、稳定且高性能的AI编译器软件平台产品。
任职要求:
1.熟练掌握Python/C++编程技能,有扎实的编程基础、良好的编程风格和工作习惯;
2.至少满足以下中的一项:
1)有TVM/MLIR/XLA或者自研AI编译器相关开发经验者;
2)有GCC、LLVM和Open64等开源编译器相关开发经验;
3)有复杂算法(如图像与视频处理、计算机视觉等)CUDA/OpenCL/汇编级优化经验者;
4)了解深度学习算法(如CNN/RNN/LSTM等)者;
5)熟悉Caffe/Tensorflow/Mxnet/Pytorch/ONNX等深度学习框架至少一种者;
6)了解CPU或GPU架构。
7)出色的书面和口头沟通技巧。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
1、和软件/硬件工程师协同工作设计超低功耗AI加速芯片。
2、规划编写相关模块微架构设计文档。
3、编写高性能高质量的RTL源代码。
4、与算法团队合作分析性能模型,以提高整体设计性能。
5、与设计验证团队合作产生验证计划,分析覆盖率,帮助芯片仿真及debug。
6、帮助后端团队芯片的物理实现,保证功能正确。
7、提出改进意见以帮助下一代芯片设计。
8、支持芯片流片成功后的初期验证开发。
9、和软件团队协同工作,保证产品符合客户需求。
1、本科或硕士学历,电子工程或芯片设计专业3年以上工作经验。
2、熟练掌握Verilog/Systemverilog RTL代码编写技巧。
3、具有微架构/资源优化/SoC系统整合/CDC/LINT等方向的具体工作经验。
4、有性能分析,芯片时序分析,形式验证,LEC/DFT的具体设计经验。
5、了解CPU/GPU/DSP/AI加速器背景知识,有AI芯片设计经验者优先。
6、熟练掌握常用版本控制软件,比如Git。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
研究和开发深度神经网络的推理加速方案,包括但不限于模型压缩、量化,高效的网络架构搜索,与各项场景应用的端到端加速方案。工作职责包括:
1、开发通用的模型压缩工具以及在调研最新的模型压缩与加速算法,在准确性和工具易用性方面取得平衡与优化。
2、在最前沿的网络结构上测试模型加速方案并建构模型库。
3、与AI加速软件工程师合作验证工具链在各个模型场景的有效性。
4、跟进与机器学习相关领域的研究趋势。
1、CS/EE/数学本科/硕士/博士。
2、三年以上机器学习相关领域的研发经验,熟悉Tensorflow/PyTorch/MxNet等ML框架。
3、5年以上python/C/C++编程经验。于顶级AI/CV/NLP会议/期刊,如CVPR/ICCV/ECCV/ACL/EMNLP/NAACL/NIPS/ICML/ICLR/KDD/AAAI/IJCAI上的研究发表者为佳。精通数值线性代数和优化知识者为佳。
4、具有CPU,GPU,计算机体系结构和加速器方面的经验为佳。
5、较强的沟通能力,领导能力和职业道德。
欢迎加入墨芯人工智能科技 (深圳) 有限公司!如果您对以上职位感兴趣,请您发送邮件给我们,我们会尽快回复您!
深圳 (总部)
地址:
深圳市南山区粤海街道微软科通大厦24D
电话:
0755-86700125
上海 |
地址:上海市徐汇区漕宝路650号
桂林高智科技大楼1号楼10层
北京 |
地址:北京市朝阳区融科望京中心
B座2202A
商务合作: sales@moffett.ai
媒体合作: marketing@moffett.ai
墨芯提供云端和终端AI芯片加速方案,相较于现有产品算力,墨芯产品将带来数量级提升。
Copyright © 2024
墨芯人工智能科技 (深圳) 有限公司
All rights reserved.
粤ICP备2021128059号