稀疏群智感知时空单元选择策略

背景简介

  空气质量、内河水质、道路积水、热岛、噪音等,都是事关市民健康和幸福感的重要时空环境状态。通过汇集广大市民贡献的感知数据,得到及时更新的大范围细粒度城市环境地图,让市民在做关于时空选择的决策时可以趋利避害,如环境恶化时避免、逃离、警示、报告或改善。为了得到满意的以覆盖率衡量的感知质量,常规群智感知往往需要招募大量的参与者,导致成本居高不下。为了解决这个问题,稀疏群智感知(Sparse Mobile Crowdsensing)被提出,只需采集价值较高的部分子区域数据,然后以一定精度推测未采集子区域的数据,能够以较少的感知成本,达到令人满意的推测质量。

  稀疏群智感知的子区域选择可建模为主动学习问题,但常规主动学习方法不能直接使用,因为群智数据一般不满足独立同分布假设,多个样本之间还可能存在局部冗余现象。

理论和技术简介

  我们提出了主动学习式群智感知的“选择器-推测器迭代”框架;找到选择指标,适配空间或跨域相关性推测算法;设计多阶段样本选择,降低局部冗余。其中KMAL算法结合克里金插值和流形保持图缩减,在感知位置数量一定的条件下,选择出的感知位置可使全局数据质量最高。也可以采用强化学习进行子区域选择,但这样就出现悖论:强化学习模型需要大量样本进行训练,而稀疏群智感知的目标却是仅采集少量样本。我们提出了利用群智数据的时空渐变性来持续更新强化学习模型。

  

图1 整体框架

演示简介

地址:北京空气质量监测

  为了降低城市中对于此类数据的感知成本,在感知位置数量一定的条件下,目标是如何选择感知位置使得推测后的全局感知质量最高。

  演示界面分为左上、左下、右上、右下四个部分。左上可以切换显示哪种选择策略,目前演示了随机策略、手动选择策略和我们提出的KMAL策略(克里金插值结合流形保持图缩减)。左下显示了十五个站点的空气质量情况。右上提供了三种采样率,分别是5%、20%和50%。右下对比了在三种选择策略下的结果与真实值的绝对百分比误差(MAPE)。在进入该演示界面后,先选择某种选择策略(默认随机策略),再选择右上的采样率。在随机策略下,会随机地选择该采样率下对应的站点进行采样;在手动选择策略下,用户可根据提示信息,得知应当选择的站点数量,手动点击监测站点图标进行采样;在KMAL选择策略下,应用根据KMAL算法选择站点进行采样。最后,点击右上部分的底部按钮,进行全局结果的推测,结果对比将在右下部分的折线图表现出来。除此之外,用户可将鼠标悬置于任意站点图标上,将显示该站点的采样数据或推测结果。

  

图2 空气质量监测位置选择演示界面

成果列表

意见反馈