降本增效,知名快消企业FinOps落地实践

发表时间:2023-11-07 11:39

     在当今数字化和AI时代,云计算已成为企业加速创新的关键因素,而云资源的开支也成为了整个IT开支中的核心成本。在私有云和公有云的规模日益扩大的同时,大量企业在如何能更有效的使用云资源,都会面临着如下几个核心问题:

  • 传统的资源规划方式导致资源过度需求:在新业务上云过程中,云资源的申请往往会出现过量、超规格等情况,缺乏统一的规范和有效的管控手段

  • 资源运行数据无可视化能力无法统一、清晰的掌握各部门、各项目、各云产品的资源使用状况,使得云资源管理者往往陷入盲人摸象的境地

  • 闲置资源缺少回收机制系统长期低水位运行、大量已使用结束的资源未被回收、错误的使用方式更容易导致资源被浪费,平台管理方缺乏可衡量的手段和优化思路,无法做出积极有效的决策,资源被持续浪费

  • 业务单位无成本意识,成本管理缺少数据支持:IT部门缺少对各业务团队资源用量的有效跟踪,无法实现对资源的规划、用量进行有效管理,这也导致业务使用方无云成本的意识,也没有控制成本的压力

    针对这些问题,FinOps基金会提出了如何能更好打通财务和运维的FinOps理念。FinOps基金会定义了FinOps为一种不断发展的云财务管理学科和文化实践,通过帮助工程团队、财务团队和业务团队在数据驱动的决策下进行协作,使组织能够获取最大的业务价值。其实在整个IT管理领域,FinOps的价值远远不止简单的计费。下图是整个FinOps框架图,我们可以看到FinOps的实现包括多个角色,多条原则,六个领域能力,这些方面的高效实现都需要强有力的系统化平台能力提供支撑

图片

案 例 背

    本案例中,我们将介绍某国际知名快消企业,如何通过骞云科技的SmartCMP平台,将FinOps实践落地的整体方案。该企业客户的系统已经大量使用了阿里公有云和微软Azure云,诸多线上应用系统和内容管理系统也都运行在公有云上,包括云服务器、对象存储、负载均衡、弹性公网、容器镜像服务、容器服务、中间件、云数据库、BI软件等40多种云产品,随着业务系统不断上云的加速,其面临着云成本日益增长的严峻问题。经调研和分析,该企业客户的核心问题包括如下几点

一、资源浪费和闲置问题严重

    • 缓慢的资源申请和开通流程导致资源不能按需使用,“提前申请,结束后未及时回收资源”的现象非常普遍。使用骞云平台之前,资源申请需用户根据基础设施管理员提供的excel填写内容(由于每个云产品的参数、场景都不一样),中间会需要申请者和管理员进行多次沟通,最终确认后再通过邮件提交申请,然后通过MSP的人工操作开通,完成初始化和配置等一系列操作后,方可提供给用户部门使用。由于整个申请过程高度依赖人工、沟通成本高、周期长、导致业务部门会提前几周就发起资源申请的流程,而用完后的资源回收也需要漫长的流程,进而造成资源在整个过程中浪费显著

    • 非工作时间,开发测试资源被持续收费。经过对以往资源使用情况的统计和分析,发现在工作日的下班后、节假日期间,都存在大量的云资源仍在运行状态,企业为这些不必要的云资源仍在持续付费中

    • 资源规格的使用不合理资源往往被就高申请,这导致了资源使用率普遍较低,性价比差。经过调研和分析,发现其中很大一部分原因也是因为当下的资源申请、变更过程困难,流程太重,用户部门为了方便其申请,往往倾向在资源申请中都往高配提出申请

二、缺乏有效的费用数据统计和预算机制公有云控制台只能提供简单的账单和标签级别的分账统计,而该企业客户的大量云资源分布在两朵云的多个云账户下这导致了用户部门缺乏从业务视角对云资源的预算申请、配额控制、实时费用等多维度的决策数据支撑,进而导致云资源的使用方对费用成本没有感知

三、资源的安全配置不合规:由于企业的云资源数量众多,配置复杂,因此还存在部分资源没有关闭外网访问等不安全现象

解 决 方 案

    为了解决这些挑战,这家企业客户寻求了骞云科技的帮助,以改善其FinOps的效率,减少云计算成本。云科技根据其痛点和现状,经过细致的分析、研讨后,有针对性地为其提供了多层次解决方案

  • 自服务让资源随用随取,减少流程中的资源闲置和浪费,减少规格就高申请。骞云平台的自服务能力,使得资源通过自助申请并自动完成开通,极大的减少了流程等待的时间,真正实现了云资源面向业务使用方的按需实时获取。现在用户部门可以根据实际需要快速获取所需资源,不再需要等待繁复的审批流程。资源使用结束后,系统也实现了资源的自助销毁,快速回收闲置资源

图片

  • 数百种资源优化策略,主动发现闲置、低效资源:为了减少资源浪费,骞云科技的FinOps平台应用了多种资源的优化策略。除了IaaS资源,企业还大量使用了RDS数据库服务和中间件服务。这些服务拥有不同的优化策略。骞云和客户根据实际场景梳理出数十条优化策略(包括云主机低负载、未挂载的公网IP、未挂载的磁盘、无连接数的数据库资源),策略涵盖了阿里云、Azure上的虚拟机、数据库、容器服务和中间件服务,帮助企业管理和优化了云资源,极大降低了云成本。同时,也根据客户的安全要求,制定了相关的安全优化策略帮助企业提高安全性,减少潜在风险

图片

  • 精细化自动停机策略,实现费用的全面优化:为了有效降低成本,我们在处理阿里云和Azure云的云服务时注意到,在关机状态和非关机状态下,收费差异非常显著,以云主机为例,关机状态下的费用仅为非关机状态费用的大约5%

         为了减少非工作时间的资源开支,骞云平台提供了的定时策略开关机能力,实现了资源的自动启停,特别是在非工作时间,如工作日、法定节假日和调休日等。管理员可以设置全局策略,同时普通用户也有灵活配置策略的权限,当有特殊需求,如加班或其他情况,他们可以通过平台提交定时策略变更申请,经管理员审批后就可生效。一旦申请获得批准,系统会将相关资源从全局策略中排除,直到申请过期后再次自动加入到全局开关机计划中

           这种方法使客户能显著降低开发和测试资源的费用,同时保持了系统的弹性和用户友好性,确保资源在需要时可供使用,同时在非工作时间降低成本。这为客户提供了经济实惠的解决方案,同时满足了灵活和效率的兼顾

  • 组织级别的费用感知与责任下放:通过骞云平台的费用采集、分摊和分析功能,客户获得了可视化和多维度的云成本展示能力,使得云资源管理员、项目管理员、开发人员都能够更准确地了解和控制费用。通过对组织架构和配额的预设,骞云平台还帮助客户建立了清晰的费用责任制度,每个部门和项目管理员现在都能更直观地了解到他们的云支出,这使得他们能做出更明智的决策,降低成本

成 果

    通过骞云平台先进的FinOps平台赋能,这家企业实现了卓越的FinOps实践,并收获了以下显著成果:
  • 费用节省:上线后每月云成本节约25%。这个数字不仅非常直观和显著,而且对于企业来说是一笔非常可观的财务收益。费用的节省使得企业可以更专注于重要的项目和投资,推动企业的创新和增长

  • 灵活性和高效性通过资源的自服务管理,项目启动速度明显提快,资源获取和管理更灵活高效。资源优化策略的应用使资源使用率大幅提高,确保了资源的最佳利用

  • 通过平台提供的组织和费用管控,企业现在能更全面地了解到资源使用情况。这对于项目的决策、资源的规划和性能优化都起到了至关重要的作用

  • 财务的可持续性由于费用感知与责任下放机制的引入,企业内部建立了更加明晰的费用责任制度,每个部门和项目都开始对云计算费用负起了责任。这鼓励了员工更积极的参与到费用管理,并更谨慎地使用资源

  • 业务部门满意度的提高:资源管理自服务的引入不仅提高了资源获取的效率,减少了资源申请、变更的等待时间,以及费用数据的透明化都将更多的选择权交给用户部门

展 望

      随着云计算和AI的不断发展和普及,多云管理、运维和费用控制已经成为了企业战略的关键组成部分。该企业客户通过现代化的FinOps落地,更好地应对了这些挑战,大幅提高了云资源的使用效率并显著降低了云成本。未来,该企业计划进一步扩展骞云平台的使用,将其应用于更多的部门和项目,以实现更大范围的费用节省和效率提升。同时,他们也计划探索更多创新性的云计算技术,不断提升其数字化能力,为客户和消费者提供更优质的产品。

      从上述案例分析可见,无论是中型企业还是大型组织,通过FinOps实践的引入,都可以提高资源利用率、并降低成本、实现更精细化的资源管理能力,在可持续性发展和社会责任方面作出积极的贡献。通过合理的工具改进资源管理和落地FinOps实践,企业将能够更好地应对未来的数字化挑战,创造更加繁荣的未来。未来,骞云科技仍将坚持推进IT资源管理服务体系和运维体系的进一步完善,提高整体行业的数字化水平。


 
 
 联系方式
咨询电话:400-669-7728