多模态算法工程师(视觉+语言)简历示例

7年多模态AI研发经验,精通CLIP/BLIP等视觉语言模型,主导亿级用户产品算法优化,在CVPR/ICCV发表论文3篇

resume.json
$

张明

_
// 多模态算法工程师(视觉+语言)
phone: 137****8901 email: zhang.multimodal@example.com exp: 7年 birth: 1992-05-10 gender:

< 求职意向 />

期望薪资 60K-85K
所在城市 深圳

< 自我评价 />

专注多模态人工智能研究与应用7年,深耕视觉-语言跨模态理解领域。精通CLIP、BLIP、Flamingo等前沿模型架构,具备从理论研究到工程落地的全栈能力。在CVPR、ICCV等顶会发表论文3篇,拥有5项发明专利。曾主导多个亿级用户规模的多模态搜索与推荐系统,擅长大规模分布式训练与模型压缩优化。熟悉PyTorch/TensorFlow深度学习框架,具备扎实的数学基础与算法创新能力。

< 工作经历 />

腾讯 资深多模态算法专家
2021.08-至今
部门AI研究院

• 主导视频号多模态内容理解系统重构,设计统一的视觉-语言表征学习框架,支撑日均10亿次视频检索请求,召回率提升25% • 研发跨模态检索增强生成(RAG)技术,融合图像、文本、音频多源信息,将视频标签自动生成准确率从72%提升至91%,人工审核成本降低65% • 构建十亿级参数多模态大模型训练基础设施,优化ZeRO-3并行策略与混合精度训练,将千卡集群训练效率提升至78%,单次训练周期缩短40% • 带领15人算法团队完成技术攻关,建立多模态算法评估体系与AB测试平台,推动6项核心技术在生产环境落地,累计创造商业价值超2亿元

百度 高级算法工程师
2019.03-2021.08
部门搜索事业部

• 负责百度图片搜索语义理解模块升级,引入CLIP模型实现图文联合Embedding,搜索相关性NDCG@10提升18%,月活用户增长12% • 设计多粒度视觉特征提取pipeline,结合ViT与ResNet优势,在ImageNet Top-1准确率达88.5%,超越基线模型3.2个百分点 • 开发跨模态相似度计算服务,支持亿级向量实时检索,P99延迟控制在30ms以内,QPS峰值达5万+ • 发表CVPR论文《Cross-Modal Attention Network for Fine-Grained Image-Text Matching》,引用次数超200次

商汤科技 计算机视觉算法工程师
2017.07-2019.03
部门视觉技术部

• 参与人脸识别系统核心算法研发,优化ArcFace损失函数与特征对齐策略,在LFW数据集准确率达99.85%,通过公安部安全认证 • 开发视频动作识别模型,基于SlowFast架构实现时序建模,在UCF101数据集分类准确率96.3%,部署于智慧安防产品线 • 设计模型轻量化方案,采用知识蒸馏与量化感知训练,将模型体积压缩至原大小的1/4,推理速度提升3倍,成功落地移动端应用 • 申请发明专利《一种基于注意力机制的跨模态特征融合方法》等3项,其中2项已获授权

< 项目经验 />

视频号多模态推荐引擎 技术负责人
2023.01-2024.02

面向短视频平台的智能内容理解与推荐系统,融合视觉、文本、音频、弹幕等多模态信号,实现精准的用户兴趣匹配与个性化推荐

职责 • 设计多塔式多模态Embedding架构,统一表征学习内容特征 • 引入对比学习与掩码建模预训练任务,提升小样本场景泛化能力 • 搭建在线增量学习框架,实现小时级模型更新与快速迭代 • 建立多维度评估指标体系,包括离线AUC、在线CTR、多样性等
成果 系统上线后视频搜索CTR提升30%,用户停留时长增加18%,获腾讯集团技术创新特等奖
百度图片搜索语义理解升级 核心算法工程师
2021.11-2022.10

百度图片搜索引擎智能化升级项目,引入多模态预训练模型实现语义级图文匹配,支持以图搜图、文字搜图等复杂查询场景

职责 • 微调CLIP模型适配中文场景,构建千万级图文对训练数据 • 设计分层召回策略,结合向量检索与传统倒排索引 • 优化排序模型特征工程,引入多模态交叉注意力机制 • 开发可视化分析工具,辅助bad case定位与模型调优
成果 搜索满意度评分从3.8提升至4.5,日均搜索量增长25%,技术方案推广至百度APP
跨模态细粒度匹配算法研究 第一作者
2020.03-2021.06

细粒度图文匹配研究项目,针对电商、社交等场景提出新颖的跨模态注意力网络,解决局部区域对齐难题

职责 • 提出Region-Word Cross-Attention模块,捕捉局部语义对应关系 • 设计难例挖掘策略,强化模型对细微差异的判别能力 • 在Flickr30k、COCO等基准数据集验证有效性 • 撰写学术论文并开源代码,促进社区技术交流
成果 模型在6个公开数据集刷新SOTA,被引用150+次,开源代码获Star 2000+

< 教育背景 />

清华大学 计算机科学与技术 · 博士
2012.09-2017.06

研究方向:计算机视觉与多模态学习。GPA 3.9/4.0,专业排名前5%。博士期间发表CCF-A类论文5篇,获得博士研究生国家奖学金2次。担任CVPR、ICCV审稿人。博士论文《基于深度学习的跨模态语义理解研究》获评优秀博士学位论文。

浙江大学 自动化 · 本科
2008.09-2012.06

GPA 3.8/4.0,保送研究生。获得全国大学生数学建模竞赛一等奖、ACM程序设计竞赛银牌。担任学生会科技部部长,组织黑客马拉松活动。

< 技能 />

  • PyTorch/TensorFlow
  • 多模态学习(Clip/Blip)
  • 分布式训练(DeepSpeed)
  • Transformer/ViT架构
  • CUDA编程优化
  • Python/C++
  • Docker/Kubernetes
  • Milvus/Faiss向量检索
  • SQL/Spark数据处理
  • LaTeX学术写作

< 证书 />

2023-10

英伟达官方认证的深度学习专家资质,证明具备大规模分布式训练与模型优化能力

2022-06

华为昇腾AI处理器开发者认证,掌握Ascend CANN架构与MindSpore框架使用

2021-03

国际权威的计算机视觉专项证书,涵盖图像处理、目标检测、语义分割等核心技术

2020-11

中国计算机学会颁发的专业技术会员资格,参与学术交流与技术标准制定

模板亮点

  • ATS 友好格式,轻松通过初筛
  • 专业视觉设计,第一眼出众
  • 内容完全可自定义,AI 辅助写作
  • 一键导出 PDF,随时投递
  • 生成分享链接,方便线上投递

模板信息

适用地区中国大陆
简历分类internet
导出格式PDF / 链接
浏览次数0

喜欢这个模板?

免费使用,5 分钟完成专业简历

三步完成专业简历

简洁的流程,高效的体验,让您专注于内容

01

选择模板

从数十款精选模板中挑选最适合你职位的样式,一键进入编辑器。

02

填写内容

AI 智能联想补全工作经历和技能描述,快速搭建完整简历框架。

03

导出投递

预览确认后一键导出高清 PDF,或生成在线链接直接发给 HR。

更多同类模板

查看全部

常见问题

现在开始,打造你的理想简历

免费使用全部模板,AI 智能优化,一键导出 PDF,轻松赢得面试机会