稀疏群智感知时空单元选择策略

背景简介

空气质量、内河水质、道路积水、热岛、噪音等，都是事关市民健康和幸福感的重要时空环境状态。通过汇集广大市民贡献的感知数据，得到及时更新的大范围细粒度城市环境地图，让市民在做关于时空选择的决策时可以趋利避害，如环境恶化时避免、逃离、警示、报告或改善。为了得到满意的以覆盖率衡量的感知质量，常规群智感知往往需要招募大量的参与者，导致成本居高不下。为了解决这个问题，稀疏群智感知（Sparse Mobile Crowdsensing）被提出，只需采集价值较高的部分子区域数据，然后以一定精度推测未采集子区域的数据，能够以较少的感知成本，达到令人满意的推测质量。

稀疏群智感知的子区域选择可建模为主动学习问题，但常规主动学习方法不能直接使用，因为群智数据一般不满足独立同分布假设，多个样本之间还可能存在局部冗余现象。

理论和技术简介

我们提出了主动学习式群智感知的“选择器-推测器迭代”框架；找到选择指标，适配空间或跨域相关性推测算法；设计多阶段样本选择，降低局部冗余。其中KMAL算法结合克里金插值和流形保持图缩减，在感知位置数量一定的条件下，选择出的感知位置可使全局数据质量最高。也可以采用强化学习进行子区域选择，但这样就出现悖论：强化学习模型需要大量样本进行训练，而稀疏群智感知的目标却是仅采集少量样本。我们提出了利用群智数据的时空渐变性来持续更新强化学习模型。

图1 整体框架

演示简介

地址：北京空气质量监测

为了降低城市中对于此类数据的感知成本，在感知位置数量一定的条件下，目标是如何选择感知位置使得推测后的全局感知质量最高。

演示界面分为左上、左下、右上、右下四个部分。左上可以切换显示哪种选择策略，目前演示了随机策略、手动选择策略和我们提出的KMAL策略（克里金插值结合流形保持图缩减）。左下显示了十五个站点的空气质量情况。右上提供了三种采样率，分别是5%、20%和50%。右下对比了在三种选择策略下的结果与真实值的绝对百分比误差（MAPE）。在进入该演示界面后，先选择某种选择策略（默认随机策略），再选择右上的采样率。在随机策略下，会随机地选择该采样率下对应的站点进行采样；在手动选择策略下，用户可根据提示信息，得知应当选择的站点数量，手动点击监测站点图标进行采样；在KMAL选择策略下，应用根据KMAL算法选择站点进行采样。最后，点击右上部分的底部按钮，进行全局结果的推测，结果对比将在右下部分的折线图表现出来。除此之外，用户可将鼠标悬置于任意站点图标上，将显示该站点的采样数据或推测结果。

图2 空气质量监测位置选择演示界面

成果列表

【论文】Z Yu, H Chang, Z Yu, B Guo, R Shi. “Location selection for air quality monitoring with consideration of limited budget and estimation error”, IEEE Transactions on Mobile Computing, 2021, PP(99): 1-1.
【论文】L Han, Z Yu, L Wang, B Guo. “Keeping cell selection model up-to-date to adapt to time-dependent environment in sparse mobile crowdsensing”, IEEE Internet of Things Journal, 2021, 8(18): 13914-13925.
【论文】D Lei, Z Yu, P Li, L Han, F Huang. “Using Deep Active Learning to Save Sensing Cost When Estimating Overall Air Quality”, International Conference on Green, Pervasive, and Cloud Computing. Springer, Cham, 2020: 189-204.

意见反馈