最后更新于
最后更新于
对于建立的时间序列模型, 常见的如ARIMA模型, 模型的质量如何, 评价方法需要考虑以下几个方面:
模型对数据集的描述能力, 体现了模型的拟合程度和预测准确的能力
模型本身的复杂度, 相同预测结果, 更简单的模型更合适
综合以上两者, 常用下面的几种方法对模型进行评价.
AIC, Akaike information criterion, 赤池信息量:
其中模型变量的个数, 对于ARIMA模型, 就是p+q
的值; 是损失函数, 通常使用MSE, 这在回归分析中有介绍, MSE即是均方残差, 即残差平方和除以对应的自由度, 是拟合结果与实际观测值之间差距的平方之和.
BIC, Bayesian information criterion, 贝叶斯信息量:
使用BIC的优势在于: 在维数过大且训练样本数据相对较少的情况下, 可以有效避免出现维度灾难现象.
使用:
模型得到的statsmodels.tsa.arima.ARIMAResults
结果对象中, 包含了这两种度量方法拟合后的结果值. 可以使用这种度量, 对不同参数的ARIMA模型进行评价, 从中选取最好的模型来使用.