职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
注:急招职位,待遇可谈,要求有推理优化经验。研发团队直招,非猎头职位。
职位描述:
1. 支持搜索/OCR/NLP等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责LLM大模型推理/训练优化
职位要求:
1. 熟悉linux环境,熟悉C/C 和Python,熟悉GPU体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用训练平台,熟悉OpenMMLab/HuggingFace等算法模型池,有实际应用经验
加分项:
1. 有CUDA编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉ONNX、TorchScript等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
职位描述:
1. 支持搜索/OCR/NLP等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责LLM大模型推理/训练优化
职位要求:
1. 熟悉linux环境,熟悉C/C 和Python,熟悉GPU体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如TensorRT/OpenPPL/TVM/AITemplate等
3. 熟悉Pytorch等常用训练平台,熟悉OpenMMLab/HuggingFace等算法模型池,有实际应用经验
加分项:
1. 有CUDA编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉ONNX、TorchScript等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
工作地点
地址:北京海淀区北京海淀区上地街道中关村软件园
![](http://img.jrzp.com/jrzpfile/rcw/SearchJob/images/jg.png)
![](https://img.jrzp.com/images_server/comm/nan.png)
职位发布者
HR
作业帮
![](http://img.jrzp.com/jrzpfile/provincercw/images/sfrz_yrz.png)
-
行业未知
-
公司规模未知
-
公司性质未知
-
汇苑开拓大厦