SRE 站点可靠性工程师简历示例

5年SRE经验,精通高可用架构设计与容量规划,保障系统SLA 99.99%,擅长故障应急响应与混沌工程

张明

SRE 站点可靠性工程师
手机138****6789
邮箱zhang.sre@example.com
5年工作年限
1994-05-18

求职意向

期望薪资 40K-55K
所在城市 深圳

自我评价

专注站点可靠性工程5年,具备大规模分布式系统运维与稳定性保障经验。精通高可用架构设计、容量规划与故障应急响应,曾保障多个亿级用户系统SLA达99.99%。熟悉混沌工程实践,通过故障注入验证系统韧性。擅长自动化运维工具开发、监控告警体系搭建与On-call值班管理,具备良好的抗压能力与问题解决能力。

工作经历

字节跳动 高级SRE工程师
2021.07-至今
部门基础架构部

• 负责抖音核心服务稳定性保障,设计多活容灾架构,实现同城双活+异地灾备,全年可用性达99.995%,超越SLA目标 • 建立SLO/SLI指标体系,定义错误预算(Error Budget)机制,平衡发布速度与系统稳定性,变更失败率降低50% • 主导混沌工程实践,使用ChaosBlade定期注入网络延迟、CPU满载等故障,提前发现单点故障12处,系统韧性显著提升 • 优化On-call值班流程,开发智能告警聚合工具,将告警噪音减少70%,MTTR从25分钟缩短至8分钟

美团 运维工程师
2019.09-2021.07
部门技术运营部

• 参与外卖订单系统容量规划,基于历史数据预测流量峰值,提前扩容资源,支撑双11峰值QPS 8万+零故障 • 搭建全链路监控体系,集成Prometheus+Grafana+Alertmanager,覆盖应用、中间件、基础设施三层监控 • 开发自动化故障恢复脚本,针对常见故障场景(磁盘满、进程僵死等)实现自愈,减少人工介入60% • 协助进行性能压测与瓶颈分析,识别数据库连接池、线程池等配置问题,推动优化后吞吐量提升35%

京东 系统工程师
2019.02-2019.09
部门运维中心

• 参与服务器日常运维,使用Ansible批量部署与配置管理,维护500+台Linux服务器 • 学习SRE理念,阅读《Site Reliability Engineering》等经典著作,了解错误预算与服务等级目标概念 • 协助进行日志分析与故障排查,使用ELK栈集中管理日志,快速定位问题根因 • 参与值班轮岗,学习应急响应流程与沟通协作技巧

项目经验

多活容灾架构建设 SRE负责人
2023.03-2023.12

抖音核心服务高可用架构升级,实现多活容灾与自动故障转移,确保极端情况下业务连续性

职责 • 设计单元化架构,按用户ID分片路由到不同机房 • 实现数据同步与冲突解决机制,保证最终一致性 • 开发健康检查与自动摘除故障节点逻辑 • 组织多次容灾演练,验证切换流程有效性
成果 全年SLA达99.995%,超越目标0.005%,获公司稳定性保障金奖
混沌工程实践 SRE工程师
2022.01-2022.10

美团混沌工程平台建设,通过定期故障注入验证系统容错能力,推动架构改进

职责 • 设计实验矩阵,覆盖网络、计算、存储等多维度故障 • 实现在线实验控制平台,支持灰度注入与快速回滚 • 建立实验评估体系,量化系统韧性指标 • 推动研发团队修复发现的脆弱性问题
成果 混沌工程实施后,提前发现并修复12处单点故障,系统韧性显著增强
智能告警系统 运维工程师
2020.06-2021.11

美团智能告警聚合平台建设,基于机器学习算法对告警进行聚类与去重,提升告警质量

职责 • 采集历史告警数据,训练告警关联模型 • 实现告警压缩与根因分析,合并相关告警 • 开发告警抑制规则,避免风暴式告警 • 集成钉钉/电话多渠道通知,确保关键告警必达
成果 智能告警系统上线后,告警噪音减少70%,MTTR缩短68%,值班体验大幅改善

教育背景

哈尔滨工业大学 计算机科学与技术 · 硕士
2016.09-2019.06

研究方向:分布式系统与可靠性工程。GPA 3.6/4.0,专业排名前20%。参与校企合作项目《大规模集群故障预测研究》。担任研究生会学术部干事。

北京邮电大学 网络工程 · 本科
2012.09-2016.06

GPA 3.5/4.0,获得校级二等奖学金2次。全国大学生网络技术大赛三等奖。担任学院网络协会干事。

技能

  • Linux/Shell
  • Kubernetes/Docker
  • Prometheus/Grafana
  • Python/Go自动化开发
  • Nginx/Haproxy
  • MySQL/Redis运维
  • Terraform/Ansible
  • TCP/IP网络调试

证书

2023-08

CNCF官方认证的Kubernetes管理员资质,证明具备容器化环境运维能力

2022-10

AWS官方认证的解决方案架构师资质,掌握云原生高可用架构设计

2021-07

全国计算机技术与软件专业技术资格,证明具备系统架构设计师专业能力

模板亮点

  • ATS 友好格式,轻松通过初筛
  • 专业视觉设计,第一眼出众
  • 内容完全可自定义,AI 辅助写作
  • 一键导出 PDF,随时投递
  • 生成分享链接,方便线上投递

模板信息

适用地区中国大陆
简历分类internet
导出格式PDF / 链接
浏览次数0

喜欢这个模板?

免费使用,5 分钟完成专业简历

三步完成专业简历

简洁的流程,高效的体验,让您专注于内容

01

选择模板

从数十款精选模板中挑选最适合你职位的样式,一键进入编辑器。

02

填写内容

AI 智能联想补全工作经历和技能描述,快速搭建完整简历框架。

03

导出投递

预览确认后一键导出高清 PDF,或生成在线链接直接发给 HR。

更多同类模板

查看全部

常见问题

现在开始,打造你的理想简历

免费使用全部模板,AI 智能优化,一键导出 PDF,轻松赢得面试机会