职位描述: 1、负责业务环境部署、容量管理等日常运维工作,提升业务运维自动化能力;
2、协助完善基础及业务监控,快速响应业务线上故障,保证业务可用性;
3、负责业务数据备份、定期巡检,容灾演练等,提升业务容灾能力;
4、协助与跟进运维相关自动化、标准化项目的落地;
5、负责基础运维相关文档撰写;
6、参与大数据运维工具和平台的设计和开发,持续提升运维效率。
1、三年及以上互联网业务运维经验;
2、具备故障分析和处理能力,能熟练使用相关命令和工具,如:stace,netstat,dig,tcpdump等;
3、工作有条理,有责任心,具备良好的自学及新技术研究探索能力,具备良好的文档编写能力;
4、熟悉Linux环境,具备脚本编写能力,能通过脚本快速高效的完成工作,如:Shell/Python,以及awk,sed等;
5、具备网络知识,能够独立处理相关问题;
6、熟悉主流开源大数据系统,熟练掌握 Hdfs/Yan/Flink/Spak/Hive/HBase 中的任意一种,了解大数据周边生态,如 Kafka/ClickHouse/ElasticSeach 等;
7、了解容器原理,有容器、k8s容器调度工具的使用经验者优先。