简介:摘要目的分析季节性差分自回归移动平均模型(SARIMA)、广义相加模型(GAM)和长短期记忆神经网络模型(LSTM)在肾综合征出血热(HFRS)发病率拟合及预测中的效果,为优化HFRS预测模型提供参考。方法在公共卫生科学数据中心(https://www.phsciencedata.cn/)收集全国和HFRS发病率居前9位的省份(黑龙江、陕西、吉林、辽宁、山东、河北、江西、浙江和湖南省)2004-2017年HFRS逐月发病率资料,其中,2004-2016年资料作为训练数据,2017年1-12月资料作为测试数据。利用训练数据拟合全国和9个省份HFRS发病率的SARIMA、GAM、LSTM;利用拟合模型预测2017年1-12月HFRS发病率,并与测试数据比较。采用平均绝对百分比误差(MAPE)评价模型拟合及预测精度,MAPE < 20%时模型拟合或预测效果为好,20%~50%为可接受,> 50%为差。结果从总体拟合及预测效果来看,全国和黑龙江、陕西、吉林、辽宁、江西省的最优模型为SARIMA(MAPE分别为19.68%、20.48%、44.25%、19.59%、23.82%、35.29%),其中,全国和吉林省模型拟合及预测效果为好,其余均为可接受;山东、浙江省的最优模型为GAM(MAPE分别为18.29%、21.25%),其中,山东省模型拟合及预测效果为好,浙江省为可接受;河北、湖南省的最优模型为LSTM(MAPE分别为26.52%、22.69%),模型拟合及预测效果均为可接受。从拟合效果来看,GAM在全国数据中拟合精度最高,MAPE =10.44%。从预测效果来看,LSTM在全国数据中预测精度最高,MAPE = 12.23%。结论SARIMA、GAM、LSTM均能作为拟合HFRS发病率的最优模型,但不同地区拟合的最优模型表现出较大差异。今后在建立HFRS预测模型时应尽可能多地纳入备选模型进行筛选,以保证较高的拟合及预测精度。