负 责 人: |
何丽芳 |
项目类型: |
|
年 份: |
2016 |
经费来源: |
国家自然科学基金青年基金 |
研究时间: |
2016-01-01 至 2018-12-31 |
合 同 号: |
61503253 |
多源异构数据分类技术是近年来数据挖掘和机器学习领域的研究重点和热点,在网页分类、文本分类、脱机手写体字符识别、基于内容的图像和视频检索、生物信息处理等领域有着广泛的应用。然而由于先验知识的缺乏,如何构建有效融合多源数据中互补信息和相关信息的泛化模型是当前尚未解决的重要科学问题。鉴于此,本项目拟在集成学习的理论框架下展开以下三个方面研究: 针对有监督分类问题,建立特征选择与分类器优化耦合的支持向量-张量机集成模型; 针对半监督分类问题,建立特征选择与分类器优化耦合的半监督支持向量-张量机集成模 型; 针对非线性分类问题,设计基于向量-张量复合模式的非线性多核函数,并构造特征选择 与分类器优化耦合的学习算法。 项目旨在揭示模式表达影响数据分类的本质规律,提出针对多源异构数据分类关键难题的解决方案,为该方法在相关领域的应用奠定理论基础和技术基础,为研究以集成学习为代表的的机器学习算法开拓新的理论视角。