多模态算法工程师（视觉+语言）简历示例

7年多模态AI研发经验，精通CLIP/BLIP等视觉语言模型，主导亿级用户产品算法优化，在CVPR/ICCV发表论文3篇

张明

// 多模态算法工程师（视觉+语言）

phone: 137****8901 email: zhang.multimodal@example.com exp: 7年 birth: 1992-05-10 gender: 男

< 求职意向 />

期望薪资 → 60K-85K

所在城市 → 深圳

< 自我评价 />

专注多模态人工智能研究与应用7年，深耕视觉-语言跨模态理解领域。精通CLIP、BLIP、Flamingo等前沿模型架构，具备从理论研究到工程落地的全栈能力。在CVPR、ICCV等顶会发表论文3篇，拥有5项发明专利。曾主导多个亿级用户规模的多模态搜索与推荐系统，擅长大规模分布式训练与模型压缩优化。熟悉PyTorch/TensorFlow深度学习框架，具备扎实的数学基础与算法创新能力。

< 工作经历 />

腾讯资深多模态算法专家

2021.08-至今

部门 → AI研究院

• 主导视频号多模态内容理解系统重构，设计统一的视觉-语言表征学习框架，支撑日均10亿次视频检索请求，召回率提升25% • 研发跨模态检索增强生成(RAG)技术，融合图像、文本、音频多源信息，将视频标签自动生成准确率从72%提升至91%，人工审核成本降低65% • 构建十亿级参数多模态大模型训练基础设施，优化ZeRO-3并行策略与混合精度训练，将千卡集群训练效率提升至78%，单次训练周期缩短40% • 带领15人算法团队完成技术攻关，建立多模态算法评估体系与AB测试平台，推动6项核心技术在生产环境落地，累计创造商业价值超2亿元

百度高级算法工程师

2019.03-2021.08

部门 → 搜索事业部

• 负责百度图片搜索语义理解模块升级，引入CLIP模型实现图文联合Embedding，搜索相关性NDCG@10提升18%，月活用户增长12% • 设计多粒度视觉特征提取pipeline，结合ViT与ResNet优势，在ImageNet Top-1准确率达88.5%，超越基线模型3.2个百分点 • 开发跨模态相似度计算服务，支持亿级向量实时检索，P99延迟控制在30ms以内，QPS峰值达5万+ • 发表CVPR论文《Cross-Modal Attention Network for Fine-Grained Image-Text Matching》，引用次数超200次

商汤科技计算机视觉算法工程师

2017.07-2019.03

部门 → 视觉技术部

• 参与人脸识别系统核心算法研发，优化ArcFace损失函数与特征对齐策略，在LFW数据集准确率达99.85%，通过公安部安全认证 • 开发视频动作识别模型，基于SlowFast架构实现时序建模，在UCF101数据集分类准确率96.3%，部署于智慧安防产品线 • 设计模型轻量化方案，采用知识蒸馏与量化感知训练，将模型体积压缩至原大小的1/4，推理速度提升3倍，成功落地移动端应用 • 申请发明专利《一种基于注意力机制的跨模态特征融合方法》等3项，其中2项已获授权

< 项目经验 />

视频号多模态推荐引擎技术负责人

2023.01-2024.02

面向短视频平台的智能内容理解与推荐系统，融合视觉、文本、音频、弹幕等多模态信号，实现精准的用户兴趣匹配与个性化推荐

职责 • 设计多塔式多模态Embedding架构，统一表征学习内容特征 • 引入对比学习与掩码建模预训练任务，提升小样本场景泛化能力 • 搭建在线增量学习框架，实现小时级模型更新与快速迭代 • 建立多维度评估指标体系，包括离线AUC、在线CTR、多样性等

成果系统上线后视频搜索CTR提升30%，用户停留时长增加18%，获腾讯集团技术创新特等奖

百度图片搜索语义理解升级核心算法工程师

2021.11-2022.10

百度图片搜索引擎智能化升级项目，引入多模态预训练模型实现语义级图文匹配，支持以图搜图、文字搜图等复杂查询场景

职责 • 微调CLIP模型适配中文场景，构建千万级图文对训练数据 • 设计分层召回策略，结合向量检索与传统倒排索引 • 优化排序模型特征工程，引入多模态交叉注意力机制 • 开发可视化分析工具，辅助bad case定位与模型调优

成果搜索满意度评分从3.8提升至4.5，日均搜索量增长25%，技术方案推广至百度APP

跨模态细粒度匹配算法研究第一作者

2020.03-2021.06

细粒度图文匹配研究项目，针对电商、社交等场景提出新颖的跨模态注意力网络，解决局部区域对齐难题

职责 • 提出Region-Word Cross-Attention模块，捕捉局部语义对应关系 • 设计难例挖掘策略，强化模型对细微差异的判别能力 • 在Flickr30k、COCO等基准数据集验证有效性 • 撰写学术论文并开源代码，促进社区技术交流

成果模型在6个公开数据集刷新SOTA，被引用150+次，开源代码获Star 2000+

< 教育背景 />

清华大学计算机科学与技术 · 博士

2012.09-2017.06

研究方向：计算机视觉与多模态学习。GPA 3.9/4.0，专业排名前5%。博士期间发表CCF-A类论文5篇，获得博士研究生国家奖学金2次。担任CVPR、ICCV审稿人。博士论文《基于深度学习的跨模态语义理解研究》获评优秀博士学位论文。

浙江大学自动化 · 本科

2008.09-2012.06

GPA 3.8/4.0，保送研究生。获得全国大学生数学建模竞赛一等奖、ACM程序设计竞赛银牌。担任学生会科技部部长，组织黑客马拉松活动。

< 技能 />

PyTorch/TensorFlow
多模态学习(Clip/Blip)
分布式训练(DeepSpeed)
Transformer/ViT架构
CUDA编程优化
Python/C++
Docker/Kubernetes
Milvus/Faiss向量检索
SQL/Spark数据处理
LaTeX学术写作

< 证书 />

2023-10

英伟达官方认证的深度学习专家资质，证明具备大规模分布式训练与模型优化能力

2022-06

华为昇腾AI处理器开发者认证，掌握Ascend CANN架构与MindSpore框架使用

2021-03

国际权威的计算机视觉专项证书，涵盖图像处理、目标检测、语义分割等核心技术

2020-11

中国计算机学会颁发的专业技术会员资格，参与学术交流与技术标准制定

模板亮点

ATS 友好格式，轻松通过初筛
专业视觉设计，第一眼出众
内容完全可自定义，AI 辅助写作
一键导出 PDF，随时投递
生成分享链接，方便线上投递

模板信息

适用地区中国大陆

简历分类internet

导出格式PDF / 链接

浏览次数0

喜欢这个模板？

免费使用，5 分钟完成专业简历

三步完成专业简历

简洁的流程，高效的体验，让您专注于内容

选择模板

从数十款精选模板中挑选最适合你职位的样式，一键进入编辑器。

填写内容

AI 智能联想补全工作经历和技能描述，快速搭建完整简历框架。

导出投递

预览确认后一键导出高清 PDF，或生成在线链接直接发给 HR。

常见问题

现在开始，打造你的理想简历

免费使用全部模板，AI 智能优化，一键导出 PDF，轻松赢得面试机会