您的位置 首页 网络技术

outlier analysis

简介

关于时间序列的一个假设是temporal continuity. 说的是数据在时间上具有连续性, 如果不连续, 那就算是异常数据.

Temporal continuity refers to the fact that the patterns in the data are not expected to change abruptly, unless there are abnormal processes at work.

在带有时间维度的多维度数据中(例如文字流数据), temporal continuity效应是很弱的, 目前本章的时间序列检测只适用于如下两个场景:

  1. 纯时间序列数据
  2. 带有时间维度的多维度数据

在多维数据中, 异常既可以发生在时间相关的序列数据中, 也可能发生在与时间无关的独立数据点中, 前者需要检查时间上的数据连续性, 而后者的异常检测和普通数据的异常检测非常类似.

The anomalies in multidimensional streaming data could correspond to either time-instants at which aggregate trends have changed or movelties in individual data points.

Contextual or collective

时间序列中的异常只包含两种: 时间维度相关的(contextual)和时间维度无关的(整个序列数据都是异常值)

Outliers are contextual when the values at specific time stamps suddenly change with respect to their temporally adjacent values

Outliers are collective when entire time series or large subsequences within a time series have unusual shapes.

连续型数据和离散型数据

这里有要注意的地方, 两种不同类型数据的时间序列异常检测方法是不同的, 离散型数据没有连续型数据那样的大小序列的性质.

猫叔总结了 适合新手操作的副业 《淘宝虚拟产品月入2万的 6个 细分类目》的电子书 仅供参考

如果你对虚拟产品比较感兴趣,可以点击:

淘宝卖什么虚拟产品赚钱(月入2万+)

hadoopall

关于花猫大叔短视频创业 作者: hadoopall

热门文章

发表评论

电子邮件地址不会被公开。