分析和开发时变数据的算法


Jules Wulms博士 数学和计算机科学系应用几何算法研究小组的学生,为时变数据算法分析开发了一种新的理论框架 。
时变数据在我们的日常生活中起着重要作用 。股票市场,天气预报和交通信息均基于不断变化的数据 。为了有效地使用此数据,我们需要仔细分析数据以深入了解潜在的模式和过程 。这些见解可用于做出有根据的预测和决策 。在整个过程中都使用算法,以分析可用的时变数据以及计算预测和可视化,以帮助进行数据驱动的决策 。
为了有效利用算法来分析和可视化随时间变化的数据,重要的是保留数据的某些属性 。这些属性之一是随着时间的变化量 。随时间变化的数据通常会连续且平滑地更改,而没有很多大而突然的更改 。为了反映这种连续性,算法应确保输入数据中的细微变化应导致输出中的细微变化 。我们说具有这种性质的算法是稳定的,并且算法的稳定性可以作为衡量算法可以保持数据连续变化的良好程度的度量 。
【分析和开发时变数据的算法】构架
分析算法的稳定性并不是一件容易的事,因为可以通过多种方式定义稳定性 。在我们的研究中,我们开发了一个定义框架,该框架允许以各种方式测量稳定性:对于某些算法,输出可能不会连续变化,但是我们可以测量不连续性的数量,并尝试减少发生这些不连续性的频率,提高稳定性 。另一方面,当输出是连续的时,对稳定性的衡量方式有所不同,但我们应注意变化的速度 。如果我们限制在短时间内允许多少更改,我们得出的定义将非常接近上面的直观定义 。但是,实现稳定性也变得更加困难(或有时证明是不可能的) 。

稳定性框架有助于对时变数据算法进行理论分析 。我们将其应用于计算几何领域中的不同问题,以获得新的理论结果并深入了解这些几何问题的稳定性 。除了这些理论结果之外,我们还对提高受益于稳定算法的实际应用的技术稳定性感兴趣 。在我们的研究中,我们开发了用于自动生成运动数据概览可视化的新算法(见图) 。
可视化动物(在这种情况下为鱼类)运动的一种方法是概述 。专家可以使用这种概述来确定重要的时间步骤,以供进一步考虑 。概述会在每个时间点对鱼进行排序,并沿着时间轴垂直放置订单 。每条鱼都由一个像素表示,我们根据该鱼的特征对其进行着色,例如游泳角度或速度 。为了使最终的排序有用,重要的是,彼此游近的鱼也应在排序中保持接近,因为它们将表现出相似的特征 。
但是,非常重要的是连续的订购顺序必须相似,否则很难追踪到鱼类随时间的变化 。我们开发了与现有技术相同或改进的算法,能够很好地代表鱼类,但是大大提高了现有技术的稳定性 。

    推荐阅读