简介:摘要:最近出现的像物联网和大数据这样的尖端计算技术,导致了一个可以生成、收集和利用大规模数据的新时代。现在不仅可以更容易地获得数据量,而且还可以获得以前难以获得的信息和知识。在不同的领域,如能源、气候、经济、商业和医疗保健,由于数据采集故障、传输过程异常、机器运行中的设备故障等等原因,导致在这些领域往往存在数据部分缺失的问题。缺失的值被认为是数据分析中的主要障碍,因为它们扭曲了数据的统计特性,减少了可用性。缺失的值不仅会破坏原始数据分布的完整性和平衡性,而且还会影响相关场景的后续分析和应用,因此时间序列中缺失值的处理已经成为一个非常重要的问题,同时时间序列数据在数据挖掘和分析中具有重要的价值。
简介:模型的验证是指对模型的性能指标(区分度、校准度)进行考察的过程。根据考察过程中是否使用预测模型的开发队列数据,模型验证可分为内部验证和外部验证。内部验证是检验模型开发过程的可重复性,常见形式包括随机拆分验证、交叉验证、Bootstrap重抽样以及“内部-外部”交叉验证。外部验证考察的是模型的可移植性和可泛化性,常见形式包括时段验证、空间验证以及领域验证。
简介:摘要:本文主要使用统计学方法与时间序列预测模型并采用智能算法对蔬菜类商品的品类、单品销售规律和定价补货策略进行研究。为了方便处理数据和合并数据,首先对数据进行预处理,再采用线性回归、逐步回归分析探究销售总量与成本加成定价的关系,通过分析得出采用时间序列预测模型预测日补货总量和定价策略,代入python实现遗传算法解决商超收益最大化问题。
简介:【摘要】:这篇论文应用时间序列分析技术对江苏省1978-2023年地区生产总值(GDP)历史数据进行了ARIMA模型拟合和检验并用所得ARIMA模型对江苏省GDP的未来走势进行了预测。预测结果显示:在未来的十年时间里,江苏省地区的生产总值(GDP)将持续保持上升态势,年均增长率为5.5%。至2026年,江苏省的GDP总值将上升至154922.44亿元;至2028年,江苏省的GDP总值将上升至173275.26亿元;截止至2033年,江苏省的地区生产总值(GDP)将上升至221490.67亿元,与2023年江苏省的地区生产总值相比,上升了93268.47亿元,上升了73%。