简介:摘 要 由严重急性呼吸道综合征冠状病毒2型(SARS-CoV-2)所引起的2019冠状病毒(CoVid-19)疫情正在席卷全球。为了使人们更好地了解、评估和控制此次疫情,本文通过构造了一系列衡量疫情严重程度的时间序列数据,并利用逐步聚类及降维算法及最小二乘法回归分析等方法,对疫情已爆发的国家在疫情爆发期内的数据进行了时间序列和横截面的处理,构造了能够准确量化这些国家在疫情爆发后的疫情走势的疫情相对严重程度指标(Relative Severity Score)。在此基础上,通过对该指标和地理、人文和社会因素做回归分析,本文发现人口平均年龄、湿度、平均气温和风速对疫情爆发的相对严重程度具有显著的统计学意义。最后,通过将该指标带入到机器学习模型中使用回归分析对数据进行拟合,本文对疫情正在爆发的国家的未来疫情发展趋势进行了预测。