国科大研究生导师李春明团队在公众环保投诉大数据挖掘方面取得研究进展

  • 文/图 数字中心 (中国科学院城市环境研究所)
  • 创建于 2021-07-29
  • 844

  随着我国城市化水平不断提高,居民对生活品质诉求日益增强,公众环境意识显著提升,环境保护投诉的数量也随之增加,2019年全国“12369环保举报联网管理平台”共接到公众举报53万余件。区别于自上而下的传统环境监测网络,环保投诉直接来自于公众,具备快速直接反应城市环境问题、包含丰富的环境信息等特点。目前对于网络投诉这类非结构化的文本数据多是人工处理,效率较低,缺乏快速和自动化的分析流程,且未能对文本内容进行深入挖掘。本研究采用文本挖掘方法建立了环保投诉中文文本分析框架,并以广州市2年的环保投诉数据为例,提取了6类环保投诉的关键词、情感特征和环保投诉的语义网络。 

  研究发现:(1)关键词能够有效揭示不同类型环保投诉的主题,为环保管理部门开展环保投诉管理提供了准确的切入点。(2)投诉情感中光污染投诉(中位数-0.19)和电磁辐射投诉(中位数-0.10)较其他投诉类型最为消极;而电磁辐射投诉情感差异最大(标准差0.30),这可能与公众的认知有关。(3)语义网络分析(图1)表明,污染源和污染受体的关系最受公众关注,同时污染受体和污染行为、污染受体和感官特征等关系也引起了公众的重视;此外,公众对环境问题的利益相关者了解有限,在污染源、利益相关者和投诉个体三者中,利益相关者的占比最低。因此,政府在解决环保投诉问题不能仅仅关注污染源本身,污染行为和污染的感官特征也应引起重视,同时应加强对公众相关污染知识的科普和投诉的引导,促进投诉问题的高效解决。 

  该研究不仅为中文环保投诉文本的分析提供了一种技术方法,也为公众投诉大数据分析系统的建立提供了参考。相关研究成果以Can Urban Environmental Problems Be Accurately Identified? A Complaint Text Mining Method.为题发表于APPLIED SCIENCES, 焦亚冉硕士生为第一作者,李春明副研究员为通讯作者,研究得到中国科学院战略性先导科技专项(A类)(XDA23030401)和中国科学院青年创新促进会项目(2017351)的资助。

环保投诉语义网络

责任编辑:张婧睿