22023年9月大规模k8s集群的成本和服务质量优化美团容器平台降本运营落地实践陆启超/美团基础研发平台群内每日免费分享5份+最新资料300T网盘资源+40万份行业报告为您的创业、职场、商业、投资、亲子、网赚、艺术、健身、心理、个人成长……全面赋能!添加微信,备注“入群”立刻免费领取200套知识地图+最新研报收钱文案、增长黑客、产品运营、品牌企划、营销战略、办公软件、会计财务、广告设计、摄影修图、视频剪辑、直播带货、电商运营、投资理财、汽车房产、餐饮烹饪、职场经验、演讲口才、风水命理、心理思维、恋爱情趣、美妆护肤、健身瘦身、格斗搏击、漫画手绘、声乐训练、自媒体打造、效率软件工具、游戏影音……扫码先加好友,以备不时之需行业报告/思维导图/电子书/资讯情报致终身学习者社群致终身学习者社群关注公众号获取更多资料3目录数据分级:C1大规模业务集群降本挑战和难点资源利用率提升不同阶段的挑战和对应方案第一阶段:峰值利用率低于40%第二阶段:峰值利用率40%~45%第三阶段:峰值利用率45~50%实践总结及落地成果未来演进方向4大规模业务集群降本难点5目标与挑战•目标:用最小的资源成本满足业务资源使用需求,保障业务SLO。•资源利用率提升与服务质量保障互相掣肘•影响利用率和服务质量的因素多,运营场景复杂•难点:6资源利用率提升不同阶段的挑战和对应方案7资源利用率提升不同阶段•第一阶段:利用率水平低•关键思路:把资源分出去•第二阶段:利用率水平中•关键思路:资源在空间维度分合理•第三阶段:利用率水平高•关键思路:在时间、空间两个维度把资源分合理8阶段一:峰值利用率低于40%挑战:如何把资源分出去?•分配率高但实际节点资源利用率低,无法分配更多资源•资源碎片化,资源余量总量大,但对于大规格资源调度请求调度履约率难保障9阶段一:峰值利用率低于40%挑战1:分配率高但实际节点资源利用率低原因分析:业务申请实际规格和实际使用gap较大•基于经验资源规格配置不准,倾向于过配置•为可能的突发峰值预留资源10阶段一:峰值利用率低于40%业务资源使用分析与预测业务容器配置推荐数据分析推动业务运维降配确定资源超售比例应对规律洪峰提前扩容解决方案:业务资源使用分析预测•日常资源使用时间分布于峰值•节假日大促规律洪峰•历史数据确定安全buffer11阶段一:峰值利用率低于40%挑战2:资源碎片化,资源余量总量大,但对于大规格资源调度请求调度履约率难保障原因分析:k8s原...