1 / 8
文档名称:

天文的数据挖掘论文.doc

格式:doc   大小:27KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

天文的数据挖掘论文.doc

上传人:文库旗舰店 2019/12/9 文件大小:27 KB

下载得到文件列表

天文的数据挖掘论文.doc

相关文档

文档介绍

文档介绍:天文的数据挖掘论文一 、概念论述数据挖掘(Datamining),又译为资料探勘、数据采矿。是目前人工智能和数据库领域研究的热点问题,它是数据库知识发现(Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。一般是指从大量的数据中通过算法搜索隐藏于其中信息的非平凡过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。天文数据的特点及复杂性2、内容概要1-1天文数据挖掘的科学要求天体的交叉认证,交叉相关,最近临规则认证,系统的数据探索。1-2天文数据分析中的数据挖掘人工对大批量数据分析的无能为力,寻求解决方法。1-3天文中的数据挖掘所获取目标知识分类三类问题:分类问题,联系问题,时间序列问题。1-4天文数据的特点及复杂性其形态有数字,符号,图形,图像等,组织方式也各不相同,有结构,半结构和非结构数据,天文数据的海量,数据属性之间的非线性关系,数据的高维性,数据的缺值等。1-5天文学中的数据挖掘技术针对海量数据的算法研究,探讨神经网络,统计方法,模糊集的应用以及高维数据的挖掘算法。1-6天文学中的常见问题及其处理例如宇宙大尺度结构和银河系结构图像及其定量分析、各种天体特殊种类或特殊性质的恒星或星系、活动星系核、星系团等完备样本的建立与研究等。1-7天文学中数据挖掘技术所面临的挑战扩充数据挖掘算法,应用于新的数据类型,开发新的分布式的数据挖掘算法,提高数据挖掘方法的容易度。   3、具体论述(1-1科学要求)(1)天体的交叉认证::以源的位置为参量,将存在于不同数据库中的源联系起来,用以加深对证认源的新的天文理解。:gamma-:多波段数据库的交叉证认会产生一对一,一对多,多对一,多对多,甚至多对无,对于除一对一的情况,有时需要用概率方法处理。(2)::在HDF巡天中,通过双色图中作为U波段的“dropouts”证认远距离星系,在DPOSS和SDSS巡天中,通过双色图中,远离正常恒星区的特性发现高红移类星体。(3):在多维空间中运用聚类算法证认天体或现象。:在TW长蛇座中过通过天体具有相似的运动学特征,X射线发射,Hα和Li丰度,发现了人们最熟悉的年轻恒星族。(4):在数据库中广泛地应用事件驱动性和相关驱动性数据挖掘技术以偶然发现一种新天体或新类型天体。:新类型变星的发现,如:在MACHO数据中发现的“bumpers”。(1-2天文数据分析中的数据挖掘)数据挖掘在天文学上有一个非常著名的应用系统:SKICAT[外3]。它是美国加州理工学院(CIT)与天文科学家合作开发的用于帮助天文学家发现遥远的类星体的一个工具。SKICAT既是第一个获得相当成功的数据挖掘应用,也是人工智能技术在天文学和空间科学上第一批成功应用之一。利用SKICAT,天文学家已发现了16个新的极其遥远的类星体,该项发现能帮助天文工作者更好地研究类星体的形成以及早期宇宙的结构。在天文学研究以及航天数据分析中,人们遇到了一个很大的难