标题:通过跨范围限制进行动态覆盖构建的时间序列索引
下图这样就叫ACM-关系,从左下到右上,要么往上走一格,要么平走一格。
如图横轴是m,纵轴是n。ACM关系可以用于将一个n长度的序列,延展成一个m长度的序列。
以图a为例,原序列可能是x1,x2,x3. 经过转换后,就是x1,x2,x2,x3,x3.
有了ACM关系之后,我们就可以度量两个不等长序列的距离。
具体来说,要找到一个ACM-关系r,使得用r将短序列延长后,和长序列的欧式距离最小。
这个延展后的欧式距离就是新度量D,关系r就是对应的ACM关系。
ACM关系可以用于将短序列延展伸长,本节讲的近似子序列AS,可以用于将长序列变短。
基本方法就是分段做均值。问题是如何分段?
这一节讲如何利用DCRC来聚集时间序列。
建成之后,我们还可以再随便找一个满足ACM-关系的路径r,如下图,根据各维度对应的值,在各维度都取出一个值范围,就构成了一个m维空间的超矩形。
给定一个DCRC结构之后,可以和一个query算出下界距离。这个下界距离,形式上,就是对于任意一个属于这个DCRC结构内的时间序列和query的最短距离。
总的来说,HDCRC就是建了一颗R-tree,基于DCRC的范围表示。每个节点对应一个DCRC结构,也对应一个参考序列r。插入以扩展区域最小为优,分裂也以最终区域面积最小为优。