堕落不振功业废,勤耕不辍日月新

最新发布 第4页

我是IT

SRE运维(七)错误预算和持续改进

一、SLO目标与错误预算 SRE体系中的SLO制定有一个比较重要的原则就是需要获得利益干系者的认同。这些干系者包括但不限于产品经理、产品开发人员、运维人员。产品经理需要为用户负责,当SLO的指标值低于目标值时,显然会得不到用户的满意,不过产品经理也不能追求100%的SLO可靠...

Cisco交换机查看配置

查生效运行中的配置 [bahs]L2SW011>enable Password: L2SW011#show running-config[/bash] 查启动配置 L2SW011#show startup-config 保存运行配置到启动配置 L2SW011#copy runni...

SRE运维(六)如何正确制定SLO

设计SLO的目的是什么?设定SLO目标是面向客户感知的,当系统的表现高于SLO阀值时,用户感知是满意的,在低于这个值时,用户可能就会要抱怨了。不过客户满意度这是个模糊的概念,而且在不同情况下,即像你的系统的SLO达到了100%,客户可能也是不满意的。为什么会这样?先从SLO的平...

CentOS清空iptables规则

1、查看iptables配置iptables -L 2、清除默认链的规则iptables -F 3、清除自定义链iptables -X 4、保存当前规则service iptables save保存时如果报错The service command supports only ba...

使用python判断IP段可用IP及数量

使用python判断IP段可用IP及数量, 很简单.几个命令就可以(本文基于python3). >>> import ipaddress >>> for ip in ipaddress.ip_network('192.168.0.0/28')...

SRE运维(五)从SLO开始

一、SLO的重要性 SLO是(service level objective)服务质量目标的简称,其是用于定量的描述服务可靠性的程度,它是SRE实践的核心。引用google工作手册上的一段话:SRE的核以职责并不只是将”所有工作“都自动化,并保持on-call状态。其实SRE...

CentOS搭建k8s集群(6)—k8s主节点ip变更问题

k8s主节点ip变更了,从192.168.101.1变为了192.168.201.1。记录这次不成功的修改,最后还是重新初始化了,因为pod的ip还是没有变 1、现象执行命令报错kubectl get nodes Unable to connect to the server: ...

SRE运维(四)SRE的组织闭环

SRE的组织闭环在不同的公司和不同的业务线可能会有不同的方式进行闭环,我现在所有企业是以提供IAAS层服务的,由于设备量是万为单位的,根据需求,企业在原有专业组和各软硬件设备提供商之外,组建了CRE架构团队、总控调度团队、质量管控团队。这里对其分工和google体系中的提到...

SRE运维(三)SRE黄金准则

SRE的工作是由日常运维、工具研发、应急管理三部分构成的,这个在之前也提到过了。但在具体落地的时候对应的有八大黄金准则。这八大黄金准则不是GOOGLE提出的,也不是我杜撰的,是GNSEC会议上有企业提出的总结,既然有这样的总结,我想也是有一定的道理的,这里分别做下说明。 ...