- 积分
- 56
- 贡献
-
- 精华
- 在线时间
- 小时
- 注册时间
- 2018-8-22
- 最后登录
- 1970-1-1

|
发表于 2021-4-2 22:54:58
|
显示全部楼层
本帖最后由 demonisgood 于 2021-4-2 22:57 编辑
你好像理解错了交叉验证的作用,交叉验证只是用来寻找最优的参数,且交叉验证仅用于训练集(一开始就需要将数据分成训练集和测试集,严格情况下需要分为训练集 验证集 测试集)中(测试集除了在最后预报,都不用理会)。例如,以留一交叉验证为例,在最优子集回归问题中,我们可以假定最优的特征个数及其组合是存在的,假设此时的组合有(特征1,特征2)和(特征1,特征2,特征3)。假设我们的训练集为1~60个数据,那么我们可以用交叉验证的方法去预报每一个训练集的值(用2~60拟合模型预报1,用1,3~60拟合模型去预报2....),一轮下来得到预报的训练集,将预报的训练集的值与实际训练集的值对比,可以得到得分情况(得分可以用相关系数,绝对误差,R_squre得人),假设对比发现(特征1,特征2)的组合更好,那么就用(特征1,特征2)这个组合去再次拟合模型,的到最后的模型,此时就可以将这个模型拿来预报了。
|
|