免费论文查重: 大雅 万方 维普 turnitin paperpass

关于向量迁移学习支持向量回归机

最后更新时间:2024-02-26 作者:用户投稿原创标记本站原创 点赞:28812 浏览:132633
论文导读:
摘要:
传统的回归系统构建方法假设用于建模的数据是充分的,但若当前场景中重要数据信息缺失,则基于此数据集训练所得系统泛化能力较差。针对此缺陷,以支持向量回归机(SVR)为基础,提出了具有迁移学习能力的回归机系统,即迁移学习支持向量回归机(TSVR)。TSVR不仅能充分利用当前场景的数据信息,而且能有效地利用历史知识来学习,具有通过迁移历史场景知识来弥补当前场景信息缺失的能力。具体地,通过控制目标函数中当前模型与历史模型的相似性,使当前模型能在信息缺失和不足时从历史场景中得到有益信息,得到增强的当前场景模型。在模拟数据和酒类光谱数据集上的实验研究亦验证了在信息缺失场景下TSVR较之于传统回归系统建模方法的更好适应性。
关键词:
迁移学习;数据缺失;支持向量回归机;知识相关性;信息修补
0引言
在分类、回归、聚类领域,机器学习技术都已取得了重大的成就。但许多性能良好的训练学习方法都针对单一场景,当前场景的数据信息严重影响学习系统的性能。而在许多实际生产过程中,获取完整的数据以重建学习系统是昂贵的或是不现实的。一方面,部分生产过程中的实验成本较高,只能选择少量数据进行实验;另一方面,随着科技的发展,生产过程中正使用着越来越多的传感设备。由于信息采集器、传感器等设备存在短路或是其他故障的风险,其稳定性及抗外界干扰能力尚不能令人满意,此时这些设备采集到的数据往往存在信息缺失或信息不完整现象。
针对上述问题,历史场景中的数据及数据中蕴涵的历史知识对当前场景的建模来说是一种有益的补充。但利用历史数据时也会面临一些挑战,倘若当前场景跟历史场景相比已经发生了较大的漂移,此时大量历史数据反而可能会带来一些负面影响。由于信息缺失现象在实际应用中普遍存在,因此有必要研究出一种系统构建方法,能通过历史场景数据的辅助以一定程度地承受当前场景部分数据信息的缺失。
迁移学习技术借助相关场景的数据或知识以提高当前系统的泛化能力。由于支持向量机形式简洁、应用广泛,目前已有诸多基于支持向量机的迁移学习研究成果[2-7],其中近期的研究视角集中于领域自适应[4-7]。但上述成果主要是从数据分布相近的角度来研究迁移学习问题,并未研究因总体信息量稀少导致数据分布不明显现象,也未考虑到因存在局部信息段缺失而导致泛化性能恶化的现象。
在支持向量回归机(Supported Vector Regression, SVR)领域,目前尚没有文献针对信息缺失的现象展开专门的研究。在相近的领域中,Yang等融合多任务学习理念[8-10]及层次贝叶斯建模[10-11]提出层次贝叶斯框架(Hierarchical Bayesian Framework, HiRBF)[12],HiRBF方法在面对非线性迁移回归问题时有着较好的性能,但其本质上还是对历史数据与当前数据的折中,大量历史数据的采用会给当前场景的学习带来一定的干扰;蒋亦樟等[13]以模糊建模技术为基础,研究了在ML(MamdaniLarsen)型模糊系统下利用历史知识提高系统泛化能力的方法。
本文以支持向量回归机为对象来探讨迁移学习支持向量回归机(Taner learning Supported Vector Regression, TSVR)系统的构建。针对部分重要信息缺失环境下回归系统建模面临的挑战,本文提出了一种基于历史数据的迁移回归系统建模方法,依靠当前模型与历史模型之间的相似性弥补当前场景信息缺失之目标。TSVR中包含传统意义上的两个回归超平面,但其对偶问题仍相当于核化空间上的另一个支持向量回归机问题,计算复杂度和二次规摘自:毕业论文翻译www.7ctime.com
划一致。因此,本文提出的TSVR方法具有较好的适应性与实用性,特别是对于实验成本昂贵的场合,以及传感器大量存在的一些生产过程,本文方法将会有很好的潜在应用前景。
1支持向量回归机方法
传统的支持向量回归机主要有以下两类:ε支持向量回归机[14](εSVR)和ν支持向量回归机[15](νSVR)。νSVR由于其能对支持向量数目与拟合精度进行权衡而有较多的应用,本文以其为基础,探讨具有迁移学习能力的回归系统建模方法。论文导读:上一页12