• 《工程索引》(EI)刊源期刊
  • 综合性科学技术类中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于空间近邻关系的非平衡数据重采样算法

李睿峰 李文海 孙艳丽 吴阳勇

李睿峰, 李文海, 孙艳丽, 吴阳勇. 基于空间近邻关系的非平衡数据重采样算法[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2020.04.05.002
引用本文: 李睿峰, 李文海, 孙艳丽, 吴阳勇. 基于空间近邻关系的非平衡数据重采样算法[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2020.04.05.002
Resampling algorithm of imbalanced data based on neighbor relationship[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2020.04.05.002
Citation: Resampling algorithm of imbalanced data based on neighbor relationship[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2020.04.05.002

基于空间近邻关系的非平衡数据重采样算法

doi: 10.13374/j.issn2095-9389.2020.04.05.002
详细信息
  • 中图分类号: TP206.1

Resampling algorithm of imbalanced data based on neighbor relationship

计量
  • 文章访问数:  729
  • HTML全文浏览量:  133
  • PDF下载量:  14
  • 被引次数: 0
出版历程
  • 网络出版日期:  2020-05-15

基于空间近邻关系的非平衡数据重采样算法

doi: 10.13374/j.issn2095-9389.2020.04.05.002
  • 中图分类号: TP206.1

摘要: 为了提高非平衡数据集的分类精度,提出了一种基于样本空间近邻关系的重采样算法。该方法首先根据数据集中少数类样本的空间近邻关系进行安全级别评估,根据安全级别有指导的进行SMOTE升采样;然后对多数类样本依据其空间近邻关系计算局部密度,从而对多数类样本密集区域进行降采样处理。通过以上两种手段可以均衡测试数据集,并控制数据规模防止过拟合,实现对两类样本分类的均衡化。采用十折交叉验证的方式产生训练集和测试集,在对训练集重采样之后,以超限学习机作为分类器进行训练,并在测试集上进行验证。在UCI非平衡数据集和电路故障诊断实测数据上的实验结果表明,所提方法在整体上优于其他重采样算法。

English Abstract

李睿峰, 李文海, 孙艳丽, 吴阳勇. 基于空间近邻关系的非平衡数据重采样算法[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2020.04.05.002
引用本文: 李睿峰, 李文海, 孙艳丽, 吴阳勇. 基于空间近邻关系的非平衡数据重采样算法[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2020.04.05.002
Resampling algorithm of imbalanced data based on neighbor relationship[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2020.04.05.002
Citation: Resampling algorithm of imbalanced data based on neighbor relationship[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2020.04.05.002

目录

    /

    返回文章
    返回