职位描述: 岗位职责:
1、监控和处理生产环境网络服务突发故障,保障网络服务稳定运行;
2、负责系统及应用的安全,网络安全,数据的日常备份和应急恢复;
3、开发、完善系统监控、报警、自动部署等内部工具;
4、规划和优化网站系统架构,提升系统服务性能和服务效率;
5、规范化、自动化并且文档化系统运维工作;
6、有责任感,有担当。
任职要求:
1.大专及以上学历,4年及以上生产环境下运维工作经验;
2.熟练使用linux和优秀的排查分析解决问题能力;
3.熟练使用shell编程,了解前端技术,至少掌握python/go/java其中的一种语言进行工具开发和运维系统开发;
4.熟练使用mysql/mongo/edis/elk/abbitmq/kafka等套件进行调优;
5.熟练使用zabbix,pometheus,gafana等监控工具和saltstack/ansible等批量化管理工具;
6.熟练使用git/gitlab/jenkins等cicd套件;
7.熟悉阿里云生态,有阿里云产品相关运维管理经验;
8.有容器docke和K8s经验优先;