所获证书:
计算机等级三级数据库技术
软考软件设计师
TiDB 数据库专员 PCTA
CET-6
GPA:3.86 / 4.00(专业前5%);
2019 年开始进入某上市连锁药企广州研发部实习,2020 年开始独立带领团队负责研发项目,有 4 年研发团队管理经验,作为核心成员参与过多个大型研发项目,其中包括一个 1 千万级别的 ERP 项目;
最高峰时担任超 20 人团队的技术管理,擅长攻关解决技术问题、管理研发团队、组织团队工作,擅长引入前沿技术解决项目问题;
多次被公司评为优秀员工;
熟练掌握 Spring Cloud、Spring Boot、MyBatis Plus 等主流后端框架,能够高效构建和优化后端服务;
熟悉 MySQL,具备数据库设计和 SQL 性能优化经验;熟悉 TiDB、Elasticsearch、MongoDB 等分布式和非关系型数据库,掌握原理和使用场景;
熟悉 Redis、RocketMQ、Kafka 等常用中间件,掌握其工作原理、优缺点及部署流程;
熟练使用 IntelliJ IDEA、Git、Maven、Jenkins、SonarQube 等开发及项目管理工具;
熟悉 Apollo、Nacos、Spring Cloud Config 等配置管理中心,能够有效管理分布式系统配置;
熟悉 Telegraf、Prometheus、AlertManager、Grafana、Skywalking、ELK 等监控和告警系统,了解 Arthas 性能分析工具;
掌握 LVS、Nginx、Apisix、Tomcat 等 Web 服务器的配置、使用及集群部署技术,了解 Flink 分布式计算引擎;
熟练操作 Linux 系统,精通 Docker 及 Kubernetes 容器技术,了解 Ansible 自动化运维工具;
了解 JavaScript、jQuery、AJAX 等前端技术,熟悉 Vue.js、Layui 等前端框架;
4 年研发团队管理经验,能够有效组织团队、分配任务并推动项目进展;会制定技术规范,擅长协调和解决团队中的问题,多次进行技术分享,积极培养提升团队成员的技术能力;
熟悉 Jira、Confluence、禅道、Teambition 等项目管理与协作工具, 在项目中实践敏捷开发,正在备考 PMP;
主导设计并开发智能运维平台的后端系统与 API,确保系统具备良好的可扩展性、可靠性和高性能表现;
负责新功能的设计、实施及与现有系统的集成,确保功能符合业务需求,并严格遵循最佳实践与编码标准,提升系统的稳定性与可维护性;
协调测试团队紧密协作,进行全面的功能测试、单元测试及调试,确保软件的高质量与可靠性;
参与系统的部署与配置,及时处理故障并提供运维支持,保障系统的持续稳定运行;
积极参与跨部门团队会议和技术讨论,推动技术决策的持续改进和创新,促进团队协作与业务目标的一致性;
为团队成员提供技术指导和支持,促进知识分享与团队技术水平的提升,帮助团队在项目中不断成长;
撰写并维护详细的技术规格、系统配置与操作流程文档,确保技术文档的准确性和可用性,支持团队的长期发展和知识管理;
参与集团内多个核心项目的研发,以技术负责人的角色参与到项目的全周期研发过程中;
专注于技术问题攻关、系统性能优化、代码审查、制定规范,为团队提供技术支持,解决关键问题,提高项目效率;
最高峰时有超过 20 人规模的团队管理经验,善于组织、激励团队,推动项目顺利完成,确保团队协作高效
编写高质量的接口文档和技术规范文档,并通过技术宣讲为团队提供技术指导和支持,提升团队整体技术水平;
积极参与需求评审、技术选型、技术方案评审和测试用例评审,确保系统具备良好的可扩展性、可靠性和性能表现,为项目打下坚实基础;
作为技术委员会成员,参与多项核心技术方案评审,推动技术持续改进和创新,确保项目在技术上的领先优势;
连续两年获得评优,体现了出色的工作表现和在团队中的重要作用;
担任职责:技术负责人
核心技术:SpringCloud、MariaDB、MongoDB、Redis、RabbitMQ、Prometheus、Alertmanager、Grafana、Camunda、DataEase、Ansible、Docker、Telegraf
项目描述:该智能运维管理平台旨在提升政企 IT 运维效率和服务质量,集成了先进的监控、分析和自动化工具,为政企提供全面的运维管理解决方案。平台涵盖资产管理、实时监控、故障预警、自动化操作、服务流程管理等关键功能,支持多种 IT 基础设施和应用程序的管理与优化。
工作内容:
作为 6 人团队中的核心成员,负责平台的后端开发及部分客户运维支撑工作,确保系统功能按时交付并符合质量标准;
参与设计和开发平台核心模块,包括 CMDB 资产管理、监控数据采集告警、运维自动化等,增强系统的稳定性和可扩展性;
负责集成自研 Agent、Telegraf、Prometheus、Grafana 等系统,实现数据的实时采集、分析与可视化展示,提升了平台的监控能力;
开发并实现智能故障预警和自动化操作功能,显著提升系统的稳定性和可用性,减少了手动干预的需求;
基于 DataEase 设计和开发定制化报表和分析功能,帮助运维团队更好地监控和分析系统运行状况,优化了决策流程;
参与设计通用化流程工单系统,实现快速部署各类工单流程,提高了系统的可用性和运营效率;
通过 Ansible 和 Docker 等工具实现自动化部署,编写脚本以提升部署交付效率,实现了快速交付能力;
部署 Jenkins、Gitlab、Nexus 等核心开发组件,打造稳定的开发环境;
高效解决客户提出的各种问题,提高客户满意度;
使用 Teambition 进行需求管理、缺陷跟踪,使用公司自研知识管理平台进行项目知识管理;
担任职责:技术经理
核心技术:SpringCloud、MySQL、TiDB、Redis、Kafka、RocketMQ、ELK、Flink、Minio、Apisix、Kubernates
项目描述:基于微服务架构的 ERP 系统,最大可支持 10万+ 门店的日常运营。系统于 2022 年 6 月第一版上线,历经 1 年半的迭代与优化,于 2023 年 10 月全面上线,覆盖门店数达到 1.5万。核心数据规模包括 5亿+ 商品、2亿+ 库存、1.4亿+ 订单,日订单量超过 100 万。项目目标是确保系统在高并发和大数据量场景下的稳定性与高效性。
工作内容:
担任小组技术负责人,协助项目经理管理 7 人团队,负责技术管理工作,并与其他项目组进行沟通协作。参与需求评审、技术方案设计与评审、测试用例评审、代码评审、部署上线等关键环节,确保项目顺利推进;
设计并实施了 TiDB 到 Elasticsearch 的实时数据同步方案,利用 Flink SQL 处理 binlog 数据,采用缓存与多线程等技术手段优化数据处理能力,将订单数据、商品数据整合成宽表,优化数据查询与报表生成效率;该同步链路每分钟可处理超过 600 万条数据;
开发基于 Elasticsearch 的高性能商品搜索接口,性能相较于传统 TiDB 版本提升了 200% 以上;
利用 Arthas、SQL 执行计划分析等工具对系统性能瓶颈问题进行深入分析。通过 SQL 优化、多线程改造及缓存策略优化等方式,将大多数接口的响应时间从 3-8 秒优化至 500 毫秒以内,大幅提升了用户体验;
深入研究并解决 Redis 大内存负载、RocketMQ 队列使用、TiDB 查询慢等问题,通过性能验证与优化策略,为系统整体性能提升提供了技术支持;
优化 DTS 数据传输服务,保障库存、商品等数据在门店与系统直接同步的实时性及准确性,确保门店销售正常有序进行,提高一线门店满意度;
参与系统生产故障及问题排查,分析底层故障原因,提出优化建议,并督促组内成员快速落地,避免重复出现类似问题;
全程参与系统上线切换工作,完成多次通宵支持,确保系统平稳切换。保障切换后门店销售正常进行,达到预期目标;
使用 Jira 进行问题跟踪,使用 Confluence 进行知识管理;
担任职责:技术经理
核心技术:SpringCloud、MySQL、Oracle、Redis、Kafka、RocketMQ、Hbase、ELK、Flink、Minio、Apisix、Docker、Kubernates
项目描述:该项目围绕公司核心业务开发了一系列平台和 API,支持业务部门及其他开发团队使用,涵盖了 MDM 主数据中心、实时计算平台、报表平台、搜索平台、文件存储平台等多个核心业务平台,致力于构建可持续拓展的业务生态系统。
工作内容:
担任技术经理,协助 Leader 管理 20+ 人的团队,负责项目架构设计,技术管理,技术问题攻关,工作汇报,组织并推动研发任务;
完成 Apisix 网关的POC、性能测试及灰度上线方案设计;主导 LVS+Apisix 网关的上线工作,协调各方工作安排,统一行动,确保工作按计划推进,保证零事故发生,实现了路由热调整、快速降级保护、实时日志分析等功能,提高了核心网关服务的可观测性,切换后整个各平台的稳定性和可靠性显著提升;
深入参与主数据分发平台、通用接口平台、微信搜药平台、通用文件平台、日志平台、实时库存平台等系统架构设计与评审工作,确保技术方案满足预期需求,并在线上使用过程中不断优化,满足各业务部门的使用需求,并提高用户满意度;
深入分析容错性较低的接口,提出优化方案并推动实施,显著提升了接口性能,增强了服务的稳定性和健壮性;
负责上线代码的审查,及时发现潜在问题并进行调整,有效提高了生产发布质量,避免了因代码问题导致的生产事故;
快速响应生产问题处理,提出快速恢复建议,参与后续故障原因排查,并产出故障分析文档和改进建议,确保系统稳定性和问题的快速解决;
研究异地多活、RocketMQ 版本升级等新老技术的可行性,产出验证结果文档,为项目的技术决策提供支持和参考;
主导技术分享活动,促进部门成员共同进步,提升整体技术水平和知识共享氛围;
担任职责:项目负责人
核心技术:SpringCloud、MyBatis、Netty、MySQL、Redis、RocketMQ、Minio、Nginx、国标 SIP 协议、Docker
项目描述:多媒体&AI智能监控分析平台是一个集在线监控视频、客流数据收集和机器学习为一体的核心系统,旨在通过整合各类设备和技术,为集团提供统一的多媒体与 AI 智能监控分析服务。
工作内容:
担任项目经理兼技术负责人,带领 6 人团队,按照业务部门的项目要求,组织团队按时、高质量地完成研发任务;
主导多媒体&AI智能分析平台的开发,通过整合不同供应商设备,实现统一的对外服务能力。截止 2021 年底,平台成功接入 6000+ 门店和 15000+ 设备,平台运行平稳,为集团提供安全可靠的监控与分析服务;并完成了供应商平台的私有化升级验证与部署;
设计并实施基于国标 SIP 协议的监控设备接入平台技术方案,负责架构设计、研发和部署计划。推动项目组按时完成各项工作任务,截止 2021 年底,平台成功接入 1600 多台设备,拓展了多媒体与 AI 智能分析平台的应用场景;
负责 AI 中台的设计与研发,封装各类 AI 智能算法并统一提供服务,利用开源技术验证多种 AI 算法。AI 中台实现了快速无感配置和故障自动切换功能。截止 2021 年底,AI 中台每日算法调用量超过 4 万次,峰值 QPS 达 100+;
设计并开发客流接口平台,利用队列、多线程、缓存等技术进行优化,实现客流设备数据的高效传输。平台每日收集数据超过 1 亿条,峰值 QPS 达 600+,为大数据团队提供了详尽的数据支持;
根据运维需求,设计并研发 20+ 定时任务程序,自动化处理重复性工作,运维效率提升近 100%。这些工具为运维团队提供了高效支持,显著提高了成本效益和工作效率;