1 / 11
文档名称:

专业英语论文(精).doc

格式:doc   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

专业英语论文(精).doc

上传人:13431315 2016/4/28 文件大小:0 KB

下载得到文件列表

专业英语论文(精).doc

相关文档

文档介绍

文档介绍:Online Feature Selection for Mining Big Data 挖掘大数据的在线特征选择 Steven . Hoi ?, Jialei Wang ?, Peilin Zhao ?, Rong Jin ?? School puter Engineering, Nanyang Technological University, Singapore ? Department puter Science and Engineering, Michigan State University, USA {chhoi, , zhao0106}***@, ******@ ABSTRACT 摘要 Most studies of online learning require accessing all the attributes/ features of training instances. Such a classical setting is not always appropriate for real-world applications when data instances are of high dimensionality or the access to it is expensive to acquire the full set of attributes/features. To address this limitation, we investigate the problem of Online Feature Selection (OFS) in which the online learner fixed number of features. The key challenge of Online Feature Selection is how to make accurate prediction using a small and fixed number of active features. This is in contrast to the classical setup of online learning where all the features are active and can be used for prediction. We address this challenge by studying sparsity regularization and truncation techniques. Specifically, we present an effective algorithm to solve the problem, give the theoretical analysis, and evaluate the empirical performance of the proposed algorithms for online feature selection on several public datasets. We also demonstrate the application of our online feature selection technique to tackle real-world problems of big data mining, which is significantly more scalable than some well-known batch feature selection algorithms. The encouraging results of our experiments validate the efficacy and efficiency of the proposed techniques for large-scale applications. 大多数在线学****的研究需要访问所有的属性/培训实例特点。这样一个经典的设置并不总是适用于真实世界的应用当数据实例的高维或访问它是昂贵的,以获得全套的属性/功能。为了解决这个限制,我们调查的问题在线特征选择( OFS ),在线学只允许保持一个分类涉及一个小的和固定数目。在线功能的关键挑战选择是如何使用一个准确的预测小型和固定数量的活动特征。这是对比以经典的在线学****的设置, 所有的功能都是主动的,可用于预测。我们解决这个问题研究稀疏正则化和截断的挑战技术。具体而言, 我们提出了一种有效的算法解决问题,给出理论分析和评价建议算法的经验性能几种公共数据集的在线特征选择。我们

最近更新

双膦酸盐类抗骨质疏松药物利塞膦酸钠及其衍生.. 2页

双氢青蒿素对斑马鱼胚胎致畸作用的研究的开题.. 2页

双摆混合系统的混沌行为研究的开题报告 2页

双定壮语语法研究的开题报告 2页

双向中继网络的中继和用户对选择策略的开题报.. 2页

2024年小学生周记8篇(热) 7页

2024年小学生名言 39页

2024年小学生励志人生格言 12页

2024年小学生保护环境建议书[精选] 21页

2024年小学生交通安全主题班会主持稿 7页

原发性扩张型心肌病伴心力衰竭患者混合性肺高.. 2页

第八章消化系统疾病患儿的护理 27页

压裂泵阀箱强度研究及寿命分析的开题报告 2页

2024年小学班级工作计划范文集合七篇 17页

压控型Buck变换器系统分析及设计的开题报告 2页

2024年小学班主任教育教学工作计划 34页

第五细菌的变异 14页

卡介苗HSP70基因转染白血病细胞瘤苗制备及抗瘤.. 2页

周记小学四年级15篇 28页

南通市医疗废物处置研究及工程实例的开题报告.. 2页

2024年小学特殊教育教师年度考核工作总结 7页

2024年小学毕业简短恩师留言 16页

南宁市保险业中层管理人员的压力管理研究的开.. 2页

南京联通客户工程项目管理分析与优化的开题报.. 2页

2024年小学校本研修计划(精选22篇) 66页

南京地铁运营风险管理方法的开题报告 2页

镇重点工程项目落实实施方案 3页

06MS201-2 埋地塑料排水管道施工 57页

儿和娘初试云雨情后续 2页

实习律师申请表 3页