IT运营的人工智能(AIOps)现在正式成为IT的一部分。这种采用新一代技术的平台方法有望改变现代IT运营团队的效率和有效性,这些团队经常被洪水般的警报,数据,期限和压力所掩盖。
AIOps是Gartner Research定义的平台,结合了大数据和人工智能功能,可替代广泛的IT运营流程和任务,包括可用性和性能监控,事件关联和分析以及IT服务管理。应用程序包括文本分析,高级分析,面部和图像识别,机器学习和自然语言生成。
在本eWEEK数据点文章中,OpsRamp产品管理和云运营高级副总裁Bhanu Singh 提供了行业信息,建议在采用AIOps之前,任何组织应采取的五个步骤。
数据点1:定义用例。
首先确定AIOps在组织内可以和需要完成的任务。您是否需要通过事件补救提供服务可用性?AIOps是否应该通过警报升级,抑制和重复数据删除来支持您的ITSM实践?或者,它是您的DevOps计划的一部分,通过数据和指标提取和推理建模提供连续,可操作的见解?
数据点2:设置成功基准。
通常,AIOps的成功指标将包括平均解决时间(MTTR),预测和预防中断,提高员工工作效率以及通过重复性手动任务的自动化减少工时或通过消除多点工具而节省的成本。这些成功基准可以始终如一地验证用例的有效性和完成性。
数据点3:重要的细分数据。
拥有广泛客户群的企业,如电子商务,医疗保健组织或流媒体内容服务,将希望通过分析预测或避免服务中断的数据来确保平台可用性,低延迟数据传输和服务质量。
或者,一些运营团队对数据更感兴趣,这些数据突出了应用程序性能,正常运行时间,依赖性以及对其他系统的下游影响。
数据点4:制定适应性强的数据收集和分析计划。
AIOps工具依赖于来自可能数千个设备,组件或客户接触点的最高优先级端点的数据,这些设备,组件或客户接触点通常是庞大的IT环境。
IT运营团队必须根据算法和摄取引擎主动规划如何处理数据的各种格式和状态 - 结构化,非结构化或半结构化。随着某些数据湖泊或资源可能比其他数据更有用,这些数据可能会随着时间的推移而发展。在某些情况下,与数据无关的工具相比,本机检测将是提供更清晰数据集的更好选择。
这些数据源也将影响分析计划。在这里,您可以优化您的AIOps摄取引擎,以产生可操作的见解。
数据点5:设置自动化。
为应用程序性能监控,安全漏洞警报和资源配置等基本活动建立自动化工作流程,Runbook和流程对于AIOps准备工作至关重要。一旦确定了数据,就应该尽可能自动化,以充分利用AIOps的有效性,并将通常与警报管理相关的例行任务替换为更复杂的自动化脚本