稀疏群智感知时空单元选择策略
背景简介
空气质量、内河水质、道路积水、热岛、噪音等,都是事关市民健康和幸福感的重要时空环境状态。通过汇集广大市民贡献的感知数据,得到及时更新的大范围细粒度城市环境地图,让市民在做关于时空选择的决策时可以趋利避害,如环境恶化时避免、逃离、警示、报告或改善。为了得到满意的以覆盖率衡量的感知质量,常规群智感知往往需要招募大量的参与者,导致成本居高不下。为了解决这个问题,稀疏群智感知(Sparse Mobile Crowdsensing)被提出,只需采集价值较高的部分子区域数据,然后以一定精度推测未采集子区域的数据,能够以较少的感知成本,达到令人满意的推测质量。
稀疏群智感知的子区域选择可建模为主动学习问题,但常规主动学习方法不能直接使用,因为群智数据一般不满足独立同分布假设,多个样本之间还可能存在局部冗余现象。
理论和技术简介
我们提出了主动学习式群智感知的“选择器-推测器迭代”框架;找到选择指标,适配空间或跨域相关性推测算法;设计多阶段样本选择,降低局部冗余。其中KMAL算法结合克里金插值和流形保持图缩减,在感知位置数量一定的条件下,选择出的感知位置可使全局数据质量最高。也可以采用强化学习进行子区域选择,但这样就出现悖论:强化学习模型需要大量样本进行训练,而稀疏群智感知的目标却是仅采集少量样本。我们提出了利用群智数据的时空渐变性来持续更新强化学习模型。
图1 整体框架
演示简介
地址:北京空气质量监测
为了降低城市中对于此类数据的感知成本,在感知位置数量一定的条件下,目标是如何选择感知位置使得推测后的全局感知质量最高。
演示界面分为左上、左下、右上、右下四个部分。左上可以切换显示哪种选择策略,目前演示了随机策略、手动选择策略和我们提出的KMAL策略(克里金插值结合流形保持图缩减)。左下显示了十五个站点的空气质量情况。右上提供了三种采样率,分别是5%、20%和50%。右下对比了在三种选择策略下的结果与真实值的绝对百分比误差(MAPE)。在进入该演示界面后,先选择某种选择策略(默认随机策略),再选择右上的采样率。在随机策略下,会随机地选择该采样率下对应的站点进行采样;在手动选择策略下,用户可根据提示信息,得知应当选择的站点数量,手动点击监测站点图标进行采样;在KMAL选择策略下,应用根据KMAL算法选择站点进行采样。最后,点击右上部分的底部按钮,进行全局结果的推测,结果对比将在右下部分的折线图表现出来。除此之外,用户可将鼠标悬置于任意站点图标上,将显示该站点的采样数据或推测结果。
图2 空气质量监测位置选择演示界面
成果列表
- 【论文】Z Yu, H Chang, Z Yu, B Guo, R Shi. “Location selection for air quality monitoring with consideration of limited budget and estimation error”, IEEE Transactions on Mobile Computing, 2021, PP(99): 1-1.
- 【论文】L Han, Z Yu, L Wang, B Guo. “Keeping cell selection model up-to-date to adapt to time-dependent environment in sparse mobile crowdsensing”, IEEE Internet of Things Journal, 2021, 8(18): 13914-13925.
- 【论文】D Lei, Z Yu, P Li, L Han, F Huang. “Using Deep Active Learning to Save Sensing Cost When Estimating Overall Air Quality”, International Conference on Green, Pervasive, and Cloud Computing. Springer, Cham, 2020: 189-204.