岗位职责:1.负责公司业务系统及相关中间件的稳定运行、性能优化和故障排查,定期进行系统性能评估和容量规划,致力于不断提高其稳定性和高可用性;2.参与基础设施架构的设计、优化和升级,支持业务快速增长;3.编写运维自动化脚本,优化和维护自动化运维工具,提高运维工作效率;4.构建和优化监控可观测体系,制定相关告警机制,及时发现系统异常并处理;5.制定和完善紧急事件应急预案,并定期组织演练,以应对突发故障;6.优化安全策略,及时处理漏洞或补丁,对系统安全加固,以防范安全威胁和攻击;7.为研发团队提供运维技术支持,并定期做团队内技术经验分享;任职要求:1.教育背景:计算机相关专业及以上;2.工作经验:具备5年及以上应用/自动化运维实战经验,并熟悉软件开发流程和相关系统架构;3.软硬技能要求:1)熟悉容器(Docker/Kubernetes)及相关生态技术,有大规模K8s集群部署和运维经验;2)熟悉主流公有云(如Aliyun、AWS、腾讯云)的使用和运维;3)熟练掌握常见的CI/CD及运维自动化工具链(如Jenkins、Gitlab、Ansible、Terraform);4)熟悉除Shell之外的一种语言(如Python、Golang);5)熟悉常见的监控技术(如Prometheus、Grafana),并掌握PromQL;6)具备良好的计算机和网络知识,及相关问题排查与优化能力;7)具备较强的问题分析和解决能力,能够在高压环境下快速定位和解决问题;8)具备良好的沟通能力和团队协作精神,能够与研发、测试、产品等多部门紧密合作;9)具备良好的文档编写能力,能够清晰记录运维流程和技术方案;10)具备良好的学习能力,能沉下心钻研新技术4.加分项:1)具备运维系统与运维平台的二次开发能力及相关实践经验;2)熟悉IaC,有公有云API使用经验;3)对可观测体系具备比较深的见解,并有相关落地经验;4)有微服务架构运维经验者优先;
联系我时,请说是在58同城上看到的,谢谢!