问题描述

随着互联网的迅速发展,各种新应用的不断涌现,伴随的是数据中心中的网络流量和规模的爆炸式增长。面对如此巨大的数据流量,如何保证网络的正常运行是数据中心运维人员面对的巨大挑战。目前网络中心中部署了大量的设备,例如路由器、交换机、服务器、硬盘等。这些设备决定了流量的传输以及提供服务的稳定性,设备故障可能导致 Web 服务性能降低甚至中断,所以它们的运行情况对数据中心网络来说是至关重要的。虽然当前的数据中心有容错方案,比如改变协议和网络拓扑,使得数据中心可以自动的从故障中恢复;以及用于存储的磁盘阵列都是有冗余机制的,但是当设备出现故障时不及时的发现更换也会增加风险以及降低性能。

故障预测指的是能够提前预测设备故障的技术,通过分析设备运行时的状态,进行故障的趋势分析和预报,为设备的修复和更换提供依据。通过设计故障预测模型,推测出设备未来一段时间的运行状况,在故障发生之前提前通过预测作出判断,进而使管理和维护人员在故障发生之前采取一些有效措施,避免或者减少损失。

目前已经有很多的技术应用在了故障预测领域,比如人工智能、专家系统等。但是大多数的故障预测技术都是针对于一些特定的场景,比如医疗器械的故障预测、磁盘的故障预测,它们都是通过设备特有的参数来实现的故障预测。

常见方案

目前已经有很多的技术应用在了故障预测领域,比如人工智能、专家系统等。但是大多数的故障预测技术都是针对于一些特定的场景,比如医疗器械的故障预测、磁盘的故障预测,它们都是通过设备特有的参数来实现的故障预测。

下面列举了几个现有的故障预测方案:

1、隐式马尔科夫模型
2、核函数SVM
3、多示例学习

[1]Salfner F, Malek M. Using Hidden Semi-Markov Models for Effective Online Failure Prediction[C]// IEEE International Symposium on Reliable Distributed Systems. IEEE, 2013:161-174.

[2]Fulp E W, Fink G A, Haack J N. Predicting computer system failures using support vectormachines. WASL, 2008, 8:5–5.

[3]Sipos R, Fradkin D, Wang Z, et al. Log-based predictive maintenance[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2014:1867-1876.

注册

请输入正确的邮件格式

密码长度6-20位

两次输入密码不匹配,请重新输入

昵称已被占用,请重新输入

点击[注册],即代表你同意 《iOps注册协议》
注册

注册协议

【首部及导言】

为有效利用QQ号码资源,维护用户合法权益,特制订《QQ号码规则》(以下简称“本规则”)。请您务必审慎阅读、充分理解各条款内容,特别是免除或者限制责任的条款,以及开通或使用某项服务的单独协议,并选择接受或不接受。限制、免责条款可能以加粗形式提示您注意。

除非您已阅读并接受本规则所有条款,否则您无权申请或使用QQ号码。您申请或使用QQ号码的行为即视为您已阅读并同意受本规则的约束

一、【规则的范围】

1.1 本规则是腾讯制定的关于获取和使用QQ号码的相关规则。本规则适用于腾讯提供的需要注册或使用QQ号码的全部软件和服务。

1.2 本规则属于腾讯的业务规则,是《腾讯服务协议》不可分割的组成部分。

1.3 您通过QQ号码使用腾讯的软件和服务时,须同时遵守各项服务的单独协议。

二、【QQ号码的性质】

QQ号码是腾讯创设的用于识别用户身份的数字标识。QQ号码的所有权属于腾讯。

三、【QQ号码的获取】