趣头条云原生实践趣头条基础架构部/徐鹏CONTENTS目录01云原生落地规划020403云原生价值思考云原生演进云原生落地总结云原生价值思考基础设施2.0Kubernetes提供应用程序周期管理和ServiceMesh提供应用程序网络管理的基础设施2.0,大大提高了应用程序的可靠性和迭代效率。云原生价值思考人才转型和能力提升在容器化过程中实现人才转型和能力提升。运维从繁琐的运维工作中脱离出来,转型到SRE。研发同学也需要对容器平台有更深入的了解,才能让框架等组件匹配容器的生命周期。资源管理集中化,统一化,效率化通过Kubernetes集群管理资源,可以有效的提高资源利用率,在微服务场景下提升50%的资源利用率。云原生落地规划交付标准化运维自动化成本优化提供PaaS平台管理生命周期通过超卖,弹性削峰等能力提高资源使用率提供统一的框架进行交付云原生落地规划通过Mesh化和可观测性平台做到故障快速恢复故障治理云原生落地总结服务化Mesh化容器化云原生落地云原生落地-服务化:基础组件云原生落地-服务化:业务服务化服务化先行云原生落地-服务化:业务服务化通过服务治理项目形式推进业务服务化新服务通过管控手段接入统一框架通过ServiceMesh提供多语言支持和快速接入云原生落地-服务化:思考微服务拆分引入的问题:框架/SDK升级困难需要避免微服务集群雪崩(级联故障)调用链路复杂性能损耗管理繁琐云原生落地-Mesh化:虚拟机时代云原生落地-Mesh化:容器时代云原生落地-Mesh化:容器时代云原生落地-Mesh化:注册发现统一云原生落地-Mesh化:自动注入&流量拦截云原生落地-Mesh化:自适应负载均衡P2CClientSuccess/serverCPU*math.Sqrt(latency+1)*(inflight+1)ClientSuccess:客户端的请求成功率(EWMA计算方式)serverCPU:通过每次请求response的header返回,服务端的CPU使用率latency:客户端计算的延时(滑动窗口)inflight:正在发送中的请求数量云原生落地-Mesh化:自适应负载均衡P2C•通过配合调整HPA值,可节省资源10%~15%•入口网关层整体延时下降2ms云原生落地-Mesh化:自适应限流自适应限流算法:[(cpu>90%&&errRate>1%)||(errRate>10%)]AND[maxPass*minRT*windows/1000)90%&&errRate>1%)||(errRate>10%)为前置条件maxPass:最近5s内,单个采样窗口中最大的成功请求数minRT:最近5s内,最小的单个采样窗口成功请求的平均响应时间windows:一秒内采样窗口的数量,默认配置中是5s50个采样,那么windows的值为10inflight:当前并...