集成微系统科学工程与应用重点实验室
The Key Laboratory of Integrated Microsystems

机器学习算法在地震预测中的应用

时间:2020-06-11

作为一种破坏力强大的自然灾害,地震灾害对人类的生命财产安全造成了巨大的损失。尽管准确地预测地震三要素(震级、震中和发震时间)可以极大地减少损失,但对该三要素的预报依然是世界性的难题,现有的地震预测预报工作依然处在探索阶段,地震预测研究尚需更加丰富的观测方法和更加多样的震前异常信息。除此之外,对于异常信息的分析也极为重要。

随着科学研究、生产消费等社会各领域积累的数据以史无前例的速度迅速膨胀,人们意识到大数据时代已经来临。充分利用海量数据信息,挖掘其中蕴含的价值,已成为学术界、工业界以及各国政府的普遍共识。。近年来,机器学习在理论、方法、应用方面取得了卓越的成果。正如Science近期发表的综述文章所言[5],机器学习是当前发展最迅速的信息科学技术领域之一。目前机器学习已成为求解许多应用问题的主要技术手段,近年,国际上地震领域杰出的研究成果也一般产出于此,即地震前兆与人工智能技术相结合的跨学科研究之中。

目前,机器学习模型在临震预测方面的成果鲜有报道,但它在长、中期地震预测中皆取得了不错的效果,并在短期地震预测中有所进展。

2007年,Panakkat和Adeli[4]提出了一种使用地震活动指标进行地震预测的重要方法[6]。这些指标根据地震的时间分布进行计算,代表该地区的潜在地震状态。作者将得到的8个地震参数分别与递归神经网络(RNN),反向传播神经网络(BPNN)和径向基函数(RBF)结合使用,并将该模型应用到南加州及旧金山湾区的预测研究中。结果表明,与其他两个神经网络相比,RNN具有更好的效果。在此研究之后,2009年,Adeli和Panakkat将模型更换为概率神经网络(PNN),使用相同的地震特征对同一区域的地震进行预测,结果显示,PNN对于震级小于6.0的地震具有更好的表现。

2012年,聂红林等[7]提出了以线性回归及BP神经网络技术为基础,对1970年1月1日至2000年12月31日期间,华北、华南两大地震区的交接部位,未来6个月地震的震级进行预测。经反演实验,误差分别为±0.78级及±0.61级。

2016年,朱海宁[8]使用改进的支持向量机对我国的最大震级进行预测。该方法以单位时间窗口内的地震频次N,最大震级M,平均震级Mbar,折合能量N*为一组数据,以1年为步长,向后平滑构建数据集。该数据集被喂入SVM算法中做回归分析,得到未来一段时间内的最大震级。文章引入了小波变换确定时间窗口长度,方法为对M-T(最大震级-年份)序列进行连续morlet小波变换,再根据小波方差图确定时间序列的活跃周期,即时间窗长。作者将1900-2000年的数据作为训练集,2000-2010年的数据作为测试集。最终报准率达到93.75%。

2017年,Asim等[9]基于Gutenberg-Richter反演定律,地震事件的发生频率,前震频率,地震震级分布等地球物理事实,使用数学模型构建了8项特征,并输入模式识别神经网络,递归神经网络,随机森林和LPBoost中,对Hindukush地区未来震级进行预测。次年,Asim等[10]再次构建了Gutenberg-Richter等60项地震活动性指标来训练SVM-HNN网络,并将该模型应用在Hindukush、智利和南加州区域,对M5.0及以上的地震进行预测。相对于先前的研究,该模型在MCC,R评分、准确度等评估标准上得到明显的改善。

总体来讲,国内外关于地震预测的研究中前兆信号的研究成果比较多,取得了可喜的进展,但在地震预测模型与人工智能技术相结合的跨学科研究中,多为长期、中期预测,短临震预测仍处于探索阶段,且在实际的地震短临预测方面,整体水平较低,准确度不高[11][12],距离真正解决地震三要素难题仍有很大的距离。

为了对地震预测这一世界难题进行求解,北京大学深圳研究生院集成微系统重点实验室研制了多分量地震监测系统AETA,给地震预测带来了数据基础,同时也对如何处理AETA数据并基于AETA数据进行地震预测提出了新的要求。

基于AETA积累的数据,吕亚轩研究了地震发生前一段时间的临震特征,并构建了基于决策树和支持向量机的临震预测模型[13]。该研究解决了AETA系统在使用中遇到了因断电、断网等原因形成的数据缺失问题,对之进行了补全处理。在特征提取方面,该研究提取了基于主成分分析方法的PCAETA特征、基于Baer算子的AETA-Baer两种人工经验特征,并基于时域、能量、频率特点选取了76种通用统计特征,利用Gini系数、SLR等特征选择方法对这些特征进行了筛选,去除了其中可能包含的冗余特征,压缩数据的输入维数。选定了其中25个特征作为分类器的预测依据。研究选取了决策树和支持向量机作为最终使用的分类器,对距台站200km范围5日内的破坏性地震(震级≥Ms5.0)进行预测。在回溯实验中,临震预测模型查准率可达0.66,查全率可达0.75。

基于AETA积累的数据,张继艳研究了数据的波形特点,基于波形相似度筛选了一系列特征并建立了地震三要素的预测模型[1]。基于电磁数据出现日周期的波形特点,该研究提取了7种基本波形,利用欧式距离和余弦距离衡量目标波形与基本波形的相似度,提取波形在震例前一段时间内出现的次数,得到21种特征。又基于地声在震前出现尖峰的特点得到9种特征。提出了基于希尔伯特-黄变换的能量分析方法对电磁数据和地声数据进行特征提取,选取imfl分量,对其进行希尔伯特变换得到震前波形的瞬时能量变化,提取出36种特征。以随机森林对特征集进行了权重评估,筛选出了20个特征。以地震三要素为预测目标使用梯度提升树建立模型,取得了较好的结果。

基于AETA积累的电磁数据,刘聪评估了均值特征种的突变现象和超低频段幅值显著升高的现象与地震的关系,并围绕具有一定映震效果的电磁扰动超低频频段信号提取了一些新特征以做补充[14]。提出了一种评估电池扰动超低频特征与地震相关性的方法,包括异常检测部分与探究异常值与地震关系的时序叠加部分,对单特征异常检测使用滑动四分位法,对多为特征使用孤立森林算法,确定在多个地震阈值筛选标准下都有至少三分之一的台站其超低频特征与地震表现出良好相关性。

基于AETA电磁数据,丘志成选取了PCA方法和LCT方法作为映震异常提取方法,并基于LCT异常建立了时空映震模型,定义了临震风险分析方法,制定了预测地震三要素的方法[15]。

基于AETA数据,李柏杭分别对单个台站的一元时间序列、多个台站的多元时间序列、研究区域内地震事件频率等方面提取特征,使用滑动窗口生成了基于地理区域划分的特征空间,利用关联分析相关的理论方法对特征有效性进行了评估,选取了15个特征进行建模,并以梯度提升树算法基于特征预测了地震三要素,取得了较好的预测效果[15]。

基于AETA观测数据开展的地震临震预测模型的研究虽然有很多积累,但是距离真正意义的实战预测,还需更加丰富的样本库和实际案例论证。

参考文献

[1] 张继艳.基于AETA数据的特征权重评估及地震预测模型的研究[D].:北京大学深圳研究生院,2019.

[2] 王新安,雍珊珊,徐伯星等.多分量地震监测系统AETA的研究与实现[J].北京大学学报(自然科学版),2018,54(03):487-494.

[3] 金秀如,雍珊珊,王新安等.地震监测系统AETA的数据处理设计与实现[J].计算机技术与发展,2018,v.28;No.249(01):51-56.

[4] PanakkatA, AdeliH. NEURAL NETWORK MODELS FOR EARTHQUAKE MAGNITUDE PREDICTION USING

MULTIPLE SEISMICITY IN DICATORS[J].InternationalJournalofNeuralSystems,2007,17(01):13-33.

[5] JordanMI,MitchellTM.Machinelearning:Trends,perspectives,andprospects[J]. Science,2015,349(6245):255-260.

[6] AsimKM, AdnanI, TalatI, etal. Earthquake prediction model using support vector regressor and hybrid neural networks[J].PLOSONE,2018,13(7):e0199004-.

[7] 聂红林,袁孝,胡伍生等.基于BP神经网络技术的区域短期地震预测模型研究[J].现代测绘,2012,35(2):3-5.

[8] 朱海宁.基于改进支持向量机回归的地震预测方法研究[D].2016.

[9] AsimKM, F.Martínez-Álvarez, BasitA, etal. Earthquake magnitude prediction in Hindukush region using machinel earning techniques[J].NaturalHazards,2017,85(1):471-486.

[10] AsimKM, AdnanI, TalatI, etal. Earthquake prediction model using support vector regressor and hybrid neural networks[J].PLOSONE,2018,13(7):e0199004-.

[11] 石耀霖,孙云强,罗纲等.关于我国地震数值预报路线图的设想——汶川地震十周年反思[J].科学通报,2018,63(19):1865-1881.

[12] ZhangGM, LiuJ, ShiYL. An scientific evaluation of annual earthquake predictionability[J]. Acta Seismologica Sinica,2002,15(5):550-558.

[13] 吕亚轩.基于AETA数据的临震特征提取与预测模型研究[D].:北京大学深圳研究生院,2019.

[14] 刘聪.AETA电磁扰动原始数据的特性分析及地震相关性研究[D].:北京大学深圳研究生院,2019.

[15] 丘志成.基于AETA电磁数据的时空映震模型研究与震例分析[D].:北京大学深圳研究生院,2019.

[16] 李柏航.基于AETA数据的短临地震风险预测模型研究[D].:北京大学深圳研究生院,2019.

 

*欢迎合作~

欢迎产业界朋友洽谈合作,联合开展科研项目的产业化工作~

 

*AETA地震预测AI算法大赛播报~

本次大赛已经进入紧张刺激的决赛阶段。20个团队进入决赛,根据一周的数据对未来一周川滇地区3.5级以上的地震进行地震三要素的预测。目前已经进入第十二周~