效、安全、可靠、集约、简化等目标,实现信息基础设施的结构清晰、层次简单、统一开放、互联可靠以及灵活扩展,使IT系统能够真正友好地辅助管理者进行科学决策、在线控制和规划预测,最终达到绿色IT的目标。
而同时,IT运维部门在企业内部充当服务部门,而并非盈利部门,所以当出现金融危机,企业利润无法达标的时候,IT运维成本往往成为第一个被缩减的项目之一。很多企业都已完成IT系统的建设工作,但是缺乏有效的IT运维体系,导致IT运维成本不但已经居高不下,而且逐年增加的趋势也非常明显。
通过对运维成本的本质分析,我们发现许多企业至今在运维成本方面缺乏统一标准:一方面是运维成本紧张,系统维护不到位的现象;另一方面又存在着对运维成本控制不力,乱用和占用严重的现象。这不仅大大影响到企业利润,更为企业产品质量埋下隐患,IT运维反而成为一颗定时炸弹,随时引爆企业形象危机。
3 影响IT运维成本的因素
企业对IT运维部门的要求就是以尽可能少的成本来达到IT系统的高可用性,为企业业务保驾护航。但是,我们发现在保障高可用性的同时,有几个因素成为降低IT运维成本的“拦路虎”。
(1)高昂的来电响应式运维成本。在运维过程中,只有当故障已经发生并已造成影响时才能发现和着手处理。这种被动的、孤立的、分散的救火式运维管理模式,不但使IT运维人员终日忙碌,也使运维服务质量很难提高,响应速度过慢,对于业务影响时间过长,导致运维人员和业务部门的满意度都不高。
传统的故障来电响应式的IT运维模式不但成本高、响应模式被动,而且局限性已显露无余,往往只能做到“头痛治头、脚痛治脚”的分割式管理。在资金充足的情况下,许多救火式的成本浪费会被隐藏起来。但当经济不景气时,问题就会无处藏身,救火式的被动运维往往是成本高居不下的根本原因。
(2)缺乏规范化运维流程,导致运维成本控制不力。在运维流程上,很多企业没有明确的事件升级标准,即满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到资深工程师处理;没有事件的限级标准,没有建立优先级和解决时限的标准,不能保证事件解决的实效性和资源的有效利用;
事件产生后没有明确而唯一的责任人,从而缺乏对事件监控和跟踪机制。这些都使事件、服务请求处理过程中没有形成严格的闭环管理,也没有建立明确的重大或紧急事件处理流程,从而不能保证在事件发生后及时处理,造成许多隐性的流程处理成本。
(3)缺乏明确的运维成本标准,乱占乱用现象严重。业务部门经常会提出一些导致运维成本增加的要求,比如硬件升级、软件维护与培训等。CIO在面对这些内部需求时往往是承担着支出责任,而高层认为谁支出谁负责,这样非IT的业务部门没有为IT运维产生的成本买单,而是由IT部门实际承担了来自业务需求的IT成本。
随着IT与业务的不断融合,由于IT成本核算错位,所有的支出均计入IT部门。当经济不景气时,不但不增加IT运维成本,反而还希望压缩IT编制和预算,就加剧了IT需求和IT运维成本之间的矛盾,乱占乱用现象就更严重了。
(4)IT系统的分散化,加大对IT运维成本的负担。早期IT系统的建立完全是根据企业需求应急建立,随着企业不断进步,这导致每套系统只为一个目标服务,有可能出现某些服务器性能、容量过剩,某些服务器又出现紧缺现象而不得不进行硬件扩容。过于分散的IT系统不仅加大固定资产的严重浪费,也加大了人力维护难度和成本。
(5)对运维技术人员的依赖过大,导致运维质量风险控制不力。在IT运维中,对于运维变更没有S.O.P标准流程,变更质量完全依靠单独技术人员的技术能力。对于出现的问题也需仰