肝纤维化基于ARMA模型的时间序列特征提取步骤-武侯天下肝纤维化肝硬化

2025-07-18 10:49:13 点击：

基于ARMA模型的时间序列特征提取步骤

在上文中提到了时间序列数据检验和时间序列基于模型的分析方法应用十分广泛，利用ARMA模型对时间序列提取特征的步骤如下：

1.1 绘制时间序列的时序图。观察时间序列时序图的基本特征，其中包含是否具有周期性，趋势等，可以初步得出所分析序列是否是平稳序列，对于非平稳序列进行差分运算与之消除。

1.2 计算并绘制序列的自相关函数和偏自相关函数，通过自相关函数衰减速度和平稳准则确定序列是否平稳序列；若非平稳，则利用差分运算消除。

1.3 通过观察自相关函数和偏自相关函数，以及结合AIC和BIC准则等，确定ARMA 模型的阶数。

1.4 最后利用模型的估计算法获取模型的估计值，模型的估计值即为模型特征。

2.5随机森林分类器

随机森林是利用多棵分类回归树（Classification And Regression Tree)对数据样本进

行训练和测试的一种分类器。其中每棵树采用的训练集都是从所有的训练集中有放回采样出来的，在训练每棵树的节点时，获取的特征是从总的特征中以一定比例随机地无放

回抽取的，这个比例通常为叫rt(M)，2叫竹(^M)，2叫rt(M)。这种算法中每一棵树的

决策能力是相对较弱，但是当所有的树都组合起来分类能力还是较强的。图2-7给出了随机森林算法决策原理，当有新样本输入时，随机森林中的每棵树进行决策，判断该样本属于哪一类，再将选择最多的那一类预测为该样本的所属类。

图2-7随机森林决策原理

随机森林分类器的优点：

1. 随机森林分类器可以处理高维度数据且不用做特征筛选

2. 数据集上表现良好，训练速度快

3. 易实现并行化处理

4. 易检测特征之间的相互影响随机森林分类器实现过程如下：

1.5 给定训练集X，利用bootstrap抽样方法从训练集中有放回地抽取左个样本。

1.6 使用第一步中抽取的&个样本训练出一棵分类回归树，给定特征维数为M，从M 维特征中随机抽取m维特征，尽可能地构建子节点，生成分类回归树。

1.7 重复第一步和第二步，生成多个分类回归树，这些分类回归树就构成了随机森林。

1.8 随机森林对新的数据进行判别和分类，其分类结果是按照树的投票数目来决定

2.6本章小结

本章详细介绍了什么是ARMA模型及其基本特征。由于时间序列必须是平稳情况下才能拟合ARMA模型，介绍平稳时间序列的基本特征以及ARMA模型建立过程中数据检验方法。后面介绍了时间序列数据的预处理、ARMA模型的选择、模型阶数的确定