Auxiliary discrimination technology for suspicious data of γ dose rate based on decision tree algorithm——a case study of Xiaomaiyu station near the Fuqing coastal NPP
Abstract
γ辐射空气吸收剂量率(γ剂量率)可以快速灵敏反映人类涉核活动,拥有长期、高频、实时、原位、在线观测等优点,已被广泛应用于各国辐射监测网络。面对我国几百个观测台站的实时海量γ剂量率数据判别需求,本研究利用Python开发了一种人工智能算法——决策树算法,以福清滨海核电周边小麦屿台站为例,将2018年和2019年的γ剂量率(17520条数据)与季风、潮高、降雨等多源数据作为训练集,应用于测试集中2020年γ剂量率可疑数据辅助判别。结果表明,从8760条数据中甄别出6条可疑数据,进一步人工复核后,综合考虑降雨滞后效应和γ剂量率指数下降峰型,将决策树算法甄别出的6组“可疑数据”归类为“正常数据”,而非“异常数据”。为验证判别方法的可靠性,本研究另外选取6组高于3倍标准偏差的正常数据,开展人工复核判别,发现降雨与潮高的双重叠加效应导致γ剂量率出现较大升高,决策树算法故将其视为“正常数据”。总之,相比传统异常数据判别方法给出的115条可疑数据,本研究创新性开发的决策树算法降低94.8%的工作量,并可在服务器上建立分钟级的实时辅助判别技术,将来可应用于国家和各省市的γ剂量率实时发布系统,实现可疑数据实时预警,极大提升判别效率。面对特征机制的定量认识、训练集数据量、观测台站数量不足等问题,未来仍需进一步完善人工智能算法研发,辅助判别可疑数据,结合人工复核判别技术,更加稳健、可靠、高效地服务大数据时代下的核安全监管业务需求,为涉核舆情及时应对提供技术保障。
Key Points
- This approach identifies suspicious gamma dose rate data, improving data validation processes.
- Out of 8760 data points, only 6 suspicious cases were flagged, demonstrating high accuracy.
- Data-driven assessment was performed using a decision tree algorithm with a substantial dataset from 2018 and 2019.
- The findings highlight a significant reduction in workload by 94.8%, showing promise for future monitoring systems.