宝兰德智能运维解决方案解决方案,宝兰德软件技术服务有限公司。

一、需求背景

随着分布式架构的大量应用,设备规模大、复杂多样的软硬件导致的运维成本高、厂商管控难等问题,使得IT运维工作压力上升到一个新的台阶,随之而来的是对智能运维的思考和强烈需求。

资产管理方面:对于应用相关的各种软硬件资产如何实现标准化统一管理,量化评估,淘汰低效、无效的资产,提高资源利用率.

在系统监控方面:系统复杂度增加,零散分布的大量监控指标,无从看起,如何实现面向业务系统的软、硬件资源统一监控,监控无死角,结合AI算法实现故障提前预警与精准定位.

应用生命周期管理:刀片化主机数量激增,如何实现应用日常运维操作沉淀,实现标准化、自动化管理,降低人为故障风险的同时提升运维工作质量和效率.

故障处理方面:系统复杂度增加,如何提供端对端的故障定位手段以及故障自愈能力,实现故障的精确定位和快速处理,提高客户满意度.

运维管理方面:多厂商多业务系统,如何实现跨厂商、跨业务系统的运维统一管理,提升对厂商的运维管控力度,确保业务快速交付.

二、智能运维解决方案介绍

宝兰德智能运维解决方案以“智能运维”理念为指导,以提供智能化运维服务为主旨,建设企业级数据中心智能运维平台。以DevOps/SRE最佳实践为参考,为企业级运维从标准化、自动化向智能化的转型提供有力的支撑。通过对自动化运维、统一监控、容器化PaaS等产品的整合集成,打造传统ITIL运维与智能运维于一体的统一平台,支持传统模式和容器模式统一管理,实现“双态”运维。既可满足运维必要的流程工作,也可以实现系统的快速构建、自愈恢复,以统一门户的形式打通完备的运维工具链条实现运维工作的自治;构建智能化运维管控模型,自动识别业务问题,简化运维操作复杂度,持续改善业务健康状况,为企业SRE团队提供稳定可靠的支撑。

宝兰德智能运维解决方案涵盖以下主要产品:

应用资源管理平台AMDB:资产集中化、标准化管理,统一存储IT资产元数据,支持物理拓扑、应用拓扑、网络拓扑,实现应用资源和物理资源的双向定位,提供资源自动发现功能,减少运维工作。通过多种视图量化评估资源使用情况,提升资源利用率。

智能运维管理平台CloudLinkOPS:应用生命周期集中化、标准化、自动化管理平台,支持快速构建应用、应用批量启停、快速扩容、快速迁移、灰度发布、故障自愈等功能,提升运维质量和效率。

应用性能管理平台WebGate:实现容器和非容器环境下分布式应用7*24小时端对端的监控,针对常见故障进行智能诊断,源代码级别的精确定位根因,持续优化系统性能。

应用探测管理平台AppChecker:通过主动监控,从真实用户角度全方位监控关键业务以及服务组件的健康度,先于用户感知系统故障。

1、实现资源集中化、规范化、标准化管理

从应用的角度建立统一集中的应用资源管理平台,实现跨厂商面向应用的规范化、标准化管理。根据业务系统运行现状,建立符合业务架构现状及表现的业务模型库,并可视化展示业务配置,比如业务组件、业务应用、基础设施之间的关系以及基本信息,集中存储资产信息,提供丰富的API供第三方系统使用,以便企业准确掌握资源的使用情况,提升资源利用率。

2、应用生命周期管理标准化、规范化、自动化

项目构建、应用系统扩容、日常系统上线,所有厂商的上线流程标准化、规范化、自动化,系统软件的安装与配置基线化,确保安装完软件符合安全基线、配置基线,定制好软件模板后自动安装。所有厂商无需管理大量的启停脚本,屏蔽各个厂商自行编写脚本带来的差异性和人为维护脚本的成本。实现各种平台软件的自动安装;业务系统应用生命周期(如批量部署、启动,停止,配置修改,创建,删除)统一管理。屏蔽业务应用部署的复杂性和差异性,快速搭建基础环境,业务应用的版本和配置版本集中管理,可追溯、可快速回退,实现了跨厂商、跨业务系统的应用生命周期管理。

3、全面监控,故障自动隔离、定位和自愈

支持不同厂商多平台的硬件和软件的异构基础资源的性能监控,实现分布式环境下各计算资源、各软件服务、各业务系统的统一的面向业务性能的监控能力。在发生各种故障或性能瓶颈时,根据监控到多维度监控指标触发资源申请、应用迁移、应用伸缩、故障应急处理等自动化处理。

4、实现应用能力池化,处理能力动态伸缩

对虚拟机和物理机进行资源池化管理,弹性伸缩基于规则引擎,调度策略可灵活配置,可以根据客户请求进行动态资源调配弹性,以每个系统实际的资源消耗为依据统筹安排,统一从资源池调拨。支持共享资源池,支持按照实例、进程或主机进行弹性伸缩,以实现资源调配更加精确、灵活,有效解决系统性能瓶颈问题。比如白天CRM系统压力较大,可以从共享资源池划出主机给CRM系统使用;晚上将划出主机归还共享资源池并补充给网厅系统使用。

5、日常运维操作统一管理,场景化、自动化

对日常运维任务统一管理,固化重复执行的多步骤任务,支持shell、Perl、Python等脚本格式,运维任务可手动执行也可定时自动执行,实现日常运维任务的一键式、自动化操作。

6、数据魔方,AI决策大脑

引入算法模型,对接多种数据源,沉淀AIOps场景,智能内核驱动精细化运维,与运维操作平台联动。根据运维指标的历史信息分析,预判系统健康度趋势,实现智能辅助决策能力,为运维人员提供更精确高效的决策依据,提升决策效率,提高运维操作准确性。方案内置常见智能运维场景和算法模型,例如根源问题定位、动态阈值、容量规划和容量预测等。

7、统一门户,集中管理入口,所有操作可审计

集中管理入口,灵活的权限和角色控制,所有组建间的通信加密处理,所有操作均提供审计跟踪,安全运维,跨厂商、跨业务系统统一管理。

三、方案价值

1、大幅提升业务峰值处理能力

凭借对资源池的错峰资源调度,跨部门的云平台资源共享,解决如月底月初等忙时资源不足问题,业务峰值处理能力冗余度倍数提升。

2、显著缩短业务系统上线时间

基于自动化统一运维管理平台快速部署,用户能够在很短的时间内完成新应用系统或应用新版本上线操作。

3、大幅节省硬件采购成本

据部署宝兰德智能运维解决方案的客户统计,CPU、内存等硬件资源使用率由50%提高至80%,大幅节省硬件采购成本。

4、明显减少人力资源投入

自动部署、自动伸缩和故障自动处理、任务计划管理等智能操作机制提高了系统的自维护能力,减少了人工干预,降低了运维人工成本。

5、稳步提升客户满意度

基于规则引擎,可配置的调度策略,故障自动隔离及恢复等功能,当系统出现故障时,客户无感知,提升客户满意度。

相关新闻

联系我们

联系我们

QQ:951076433

在线咨询:点击这里给我发消息

邮件:951076433@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

分享本页
返回顶部