一、工作职责:
1、Kubernetes服务集群架构性能调优与优化: 通过设计服务架构,包括使用监控工具(如Prometheus、Grafana)对Kubernetes集群进行全面性能分析,并优化关键节点、组件和流程,以提升整体系统的稳定性和响应速度。
3、集群部署与运维: 独立负责Kubernetes集群的稳定部署、监控与维护工作,确保集群在高负载环境下的可靠运行。
4、平台化能力建设: 研究并实施Kubernetes平台化的能力建设,提升平台的扩展性、可用性和可管理性。
5、跟踪云原生生态的最新发展趋势,研究并应用新技术以提升底座的稳定性、可扩展性、可维护性。
二、岗位要求:
1、计算机科学、软件工程等相关专业本科及以上学历,3年以上容器、Kubernetes 或相关分布式系统开发经验。
2、熟练掌握 Kubernetes 核心组件的原理和开发,有二次开发能力。
3、精通 Go 或 C++ /Python编程,具有良好的代码风格和系统架构设计能力,能进行复杂系统的代码开发和调试。
4、熟悉容器技术栈(如 Docker、containerd),有容器存储、容器网络、稳定性、性能优化等相关知识。
5、有云原生项目(如 Containerd、Calico、Etcd、Cilium、Fluid等)开发经验者优先。
6、具备较强的学习能力和分析问题的能力,能够快速理解并应用新技术。
7、对AI工具研发和使用有热情。
三、加分项:
1、参与或主导过大型分布式系统/高性能计算平台的架构设计。
2、有 Prometheus、Thanos 等监控系统的运维经验,能基于实时数据进行性能及稳定性的优化。
3、熟悉服务器基础硬件与操作系统配置
