• 主导腾讯云TI平台MLOps体系建设,基于Kubeflow构建端到端ML Pipeline,支持日均500+模型训练任务,资源利用率提升60% • 设计统一特征存储Feature Store,整合离线Hive与在线Redis数据源,实现特征复用率提升80%,特征工程开发时间缩短70% • 搭建模型注册中心Model Registry,集成MLflow实现版本管理、 lineage追踪与A/B测试,模型上线周期从2周缩短至2天 • 优化模型推理服务,使用Triton Inference Server支持多框架部署,通过动态批处理与模型量化,QPS提升3倍,延迟降低50%
机器学习平台工程师(MLOps)简历示例
5年MLOps经验,精通模型训练部署全链路,主导AI平台建设,模型迭代效率提升70%
张明
求职意向
自我评价
专注MLOps与机器学习平台建设5年,具备从模型开发、训练、评估到部署监控的完整生命周期管理经验。精通Kubeflow、MLflow等MLOps工具链,熟悉分布式训练与模型服务化。曾主导多个企业级AI平台建设,模型迭代效率提升70%,推理成本降低50%。擅长自动化Pipeline设计、特征存储管理与模型版本控制,具备良好的工程能力与算法理解。
工作经历
• 负责推荐系统模型训练平台开发,基于Spark+TensorFlow构建分布式训练框架,支撑千亿样本大规模训练 • 参与模型服务化改造,使用TF Serving部署深度学习模型,实现灰度发布与自动扩缩容,P99延迟控制在20ms以内 • 开发自动化超参数调优工具,集成Optuna实现贝叶斯优化,相比网格搜索效率提升10倍,模型效果平均提升5% • 协助进行GPU集群资源调度优化,基于Volcano实现弹性配额管理,集群利用率从40%提升至75%
• 参与计算机视觉模型开发,使用PyTorch实现目标检测与图像分类算法,在公开数据集刷新SOTA • 学习MLOps理念,参与内部模型管理平台建设,了解模型版本控制与实验跟踪基本概念 • 协助进行模型压缩与加速,使用剪枝与量化技术将模型体积压缩至1/4,推理速度提升3倍 • 参与Code Review,学习工程化规范与代码质量标准
项目经验
腾讯云TI平台MLOps体系建设项目,打造一站式机器学习平台,覆盖数据处理、模型训练、评估、部署全流程
字节跳动统一特征存储平台建设,解决特征孤岛与重复开发问题,提升特征工程效率
推荐系统模型服务化改造,实现从批量预测到实时推理的架构升级
教育背景
研究方向:分布式系统与机器学习系统。GPA 3.7/4.0,专业排名前15%。参与校企合作项目《大规模深度学习训练系统优化》。担任研究生会技术部部长。
GPA 3.5/4.0,获得校级二等奖学金2次。全国大学生软件创新大赛二等奖。担任计算机学院AI俱乐部副会长。
技能
- Kubeflow/MLflow
- TensorFlow/PyTorch
- Kubernetes/Docker
- Python/Go
- Spark/Flink
- Redis/MySQL
- Prometheus/Grafana
- Git/CICD
证书
CNCF官方认证的Kubernetes管理员资质,证明具备容器化环境运维能力
阿里云官方认证的机器学习工程师资质,掌握PAI平台与MLOps最佳实践
NVIDIA官方认证的深度学习专家资质,掌握GPU加速与模型优化技术
模板亮点
- ATS 友好格式,轻松通过初筛
- 专业视觉设计,第一眼出众
- 内容完全可自定义,AI 辅助写作
- 一键导出 PDF,随时投递
- 生成分享链接,方便线上投递
模板信息
喜欢这个模板?
免费使用,5 分钟完成专业简历
三步完成专业简历
简洁的流程,高效的体验,让您专注于内容
选择模板
从数十款精选模板中挑选最适合你职位的样式,一键进入编辑器。
填写内容
AI 智能联想补全工作经历和技能描述,快速搭建完整简历框架。
导出投递
预览确认后一键导出高清 PDF,或生成在线链接直接发给 HR。
更多同类模板
查看全部常见问题
现在开始,打造你的理想简历
免费使用全部模板,AI 智能优化,一键导出 PDF,轻松赢得面试机会




