文档介绍:该【融优学堂大数据技术导论(北京理工大学)章节测验答案 】是由【青山代下】上传分享,文档一共【13】页,该文档可以免费在线阅读,需要了解更多关于【融优学堂大数据技术导论(北京理工大学)章节测验答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..青春须早为,岂能长少年。大数据技术导论(北京理工大学)解忧书店JieYouBookshop2引论【单选题】科学研究第四范式数据思维采用()。A科学归纳B模型推演C仿真模拟D关联分析正确答案:D我的答案:A2.【单选题】大数据是一个什么领域的问题()。A计算机领域B数学统计领域C业务领域D多学科综合领域正确答案:D我的答案:B3.【多选题】大数据处理框架之流计算框架()。AhadoopBSparkstreamingCFlinkDSTORM正确答案:BCD我的答案:A4.【多选题】大数据处理框架之批处理框架()。AhadoopBSparkCFlinkDjvm正确答案:ABC我的答案:A解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。【多选题】大数据的优势包括()。A数据体量大B收集时间短C数据类型丰富D价值密度高正确答案:ABC我的答案:B3大数据感知与获取1.【单选题】下面科学研究的四个范式顺序正确的是()。A经验范式-理论范式-模拟范式-数据密集型范式B理论范式-模拟范式-经验范式-数据密集型范式C理论范式-模拟范式-数据密集型范式-经验范式D理论范式-经验范式-数据密集型范式-模拟范式正确答案:A我的答案:C2.【多选题】常见的分布式网络爬虫架构有()。AMaster-workerBMaster-slaveCpeer-peerDMixed正确答案:BCD我的答案:C3.【单选题】AM1-M2-M3-S4-M5-M6-M8-S7BM1-M2-M5-M8-M6-M3-S7-S4CM1-M2-M3-S4-M5-M6-S7-M8DM1-M2-M5-M8-M6-M3-S4-S7正确答案:B我的答案:C解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。【单选题】以数据考察为基础,联合理论、实验和模拟一体的数据密集计算的范式是以下哪个范式()。A经验范式B理论范式C模拟范式D数据密集型范式正确答案:D我的答案:C5.【单选题】在大数据生命周期的各个阶段中,工作最多的是哪个阶段()。A数据存储B数据收集和整理C数据分析D数据治理正确答案:B我的答案:C6.【多选题】大数据中的非结构化数据包括()。A图像B文本C语音D视频E电子邮件FXML文档正确答案:ABCDE我的答案:B7.【单选题】在增量抽取方法中,需要计算MD5校验码的是哪种增量抽取方法()。A日志对比B时间戳C触发器D全表对比正确答案:D我的答案:D8.【多选题】以下哪些内容属于深网内容()。A通过搜索引擎搜索得到的结果解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。BWeb上可访问的非网页文件,比如图片文件,Pdf和word文档等C通过填写表单形成对后台在线数据库的查询而得到的动态页面D需要注册或其他限制才能访问的内容E由于缺乏被指向链接而没有被搜索引擎引到的页面正确答案:BCDE我的答案:D9.【单选题】在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()。A深度优先B广度优先C局部PageRank策略DOPIC正确答案:C我的答案:A10.【多选题】大数据中的半结构化数据包括()。A办公文档B电子邮件CXMLD系统日志EHTML正确答案:BCDE我的答案:C4大数据存储与管理1.【单选题】下面与HDFS类似的框架是()。ANTFSBFAT32CGFSDEXT3正确答案:C我的答案:B解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。【多选题】NoSQL数据库的明显优势在于()。:BCD我的答案:B3.【多选题】HDFS专为解决大数据存储问题而产生的,其具备了以下哪些特点()。A兼容廉价的硬件设备B流数据读写C大数据集D复杂的文件模型E强大的跨平台兼容性正确答案:ABCE我的答案:C4.【多选题】HBase的实现包括哪几个主要的功能组件()。A库函数B一个Master主服务器C一个Region服务器D许多个Region服务器正确答案:ABD我的答案:B5.【多选题】Hadoop的框架最核心的设计是()。AHDFSBMapReduceCNamenodeDDatanode正确答案:AB我的答案:B6.【多选题】下面对HBase的描述哪些是正确的()。A不是开源的B是面向列的解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。C是分布式的D是一种NoSQL数据库正确答案:BCD我的答案:C7.【多选题】分布式文件系统改变了数据存储和管理方式,相对于本地文件系统具有哪些优势()。A低成本B易扩展C强可靠D高可用正确答案:ABCD我的答案:B8.【单选题】HDFS中文件块默认保存几份()。A1份B2份C3份D4份正确答案:C我的答案:D9.【单选题】下列选项中哪些不是NoSQL数据库的特点()。A灵活的可扩展性B动态的数据迁移C与云计算紧密融合D灵活的数据模型正确答案:B我的答案:B10.【单选题】HBase依靠()存储底层数据。AHDFSBHadoopCMemoryDMapReduce正确答案:A我的答案:C解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。5大数据分析与可视化【单选题】大数据可视化分析有效融合计算机的______和人的_____,以获得对于大规模复杂数据集的洞察力。A计算能力、分析能力B计算能力、认知能力C分析能力、观察能力D认知能力、计算能力正确答案:B我的答案:A2.【判断题】D3、Echart、Datawrapper和Highcharts都是数据可视化第三方库。()正确答案:错误我的答案:正确3.【多选题】以下哪些是数据可视化的作用()。A协助思考B使用感知代替认知C作为大量工作记忆的外界辅助D理解信息正确答案:ABCD我的答案:B4.【判断题】Textflow用河流的运动表达了文本主题的诞生、发展、合并、分裂、消亡的过程。导致主题演变的原因往往是主题关键词的变化。()正确答案:正确我的答案:正确5.【判断题】PCA是一种有监督的降维方法。()正确答案:错误我的答案:正确6.【单选题】以下哪个不是数据可视化方法和技术()。A图可视化技术B多维数据可视化技术C时空数据可视化技术D混合建模技术正确答案:D我的答案:D7.【多选题】关于相邻矩阵说法,正确的是()。解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。A视觉伸缩性强B适用于密集的图C可视化结果比较抽象D容易跟踪出路径正确答案:ABC我的答案:C8.【单选题】下列关于数据可视化的介绍,不正确的是()。A可视化技术被大量应用于统计学领域、地理信息系统、数据挖掘分析、商务智能工具等B统计图表有饼图、时间序列图、散点图、等高线图等多种形式C可视化分析用到了支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术D雷达图适用于多维数据,不要求每个维度都可以排序正确答案:D我的答案:B9.【多选题】下列可以用于多维数据可视化的方法有()。AGMapB平行坐标系C雷达图D散点图矩阵正确答案:BCD我的答案:B10.【判断题】单词树把文本中的句子按树形结构布局,可以很好的看出一个单词在文本中出现的频率和单词前后的联系。()正确答案:正确我的答案:正确11.【判断题】交互的类型包括选择、探索、再布局、视觉编码、抽象化/具体化、过滤和链接。()正确答案:正确我的答案:正确12.【判断题】文本是大数据时代结构数据类型的典型代表。()正确答案:错误我的答案:正确13.【多选题】s短语网络是经典的力导向图结构,下列说法正确的是()。A节点是从文本中挖掘出的词汇级或语法级的语义单元B边代表语义单元的联系C边的方向即短语的方向解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。D边的宽度是短语在文本中出现的频率正确答案:ABCD我的答案:C14.【多选题】文本数据大致可分为三种:单文本、文档集合和时序文本数据。对应的文本可视化也可分为三类()。A文本内容的可视化B文本相似性的可视化C语义结构可视化D文本动态可视化正确答案:ACD我的答案:C15.【多选题】数据可视化用生动的、易理解的方式诠释数据之间的关系和发展的趋势,数据可视化的方式包括()。A图像B地图C动画D图形正确答案:ABCD我的答案:B6大数据处理1.【多选题】Spark支持的开发语言有()。AJavaBC语言CPythonDScala正确答案:ACD我的答案:A2.【多选题】Apache软件基金会最重要的三大分布式计算系统开源项目包括()。AHadoopBSparkCStorm解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。DHDFS正确答案:ABC我的答案:B3.【多选题】关于RDD论述正确的是()。ARDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集BRDD读取的数据都存储在一台机器上CRDD是只读存储DRDD支持各种粗粒度和细粒度的操作正确答案:AC我的答案:B4.【判断题】Hadoop擅长批处理,不适合流计算。()正确答案:正确我的答案:正确5.【单选题】Spark的组件中,用于做查询分析的是()。ASparkSQLBSparkStreamingCSparkMLibDSparkCore正确答案:A我的答案:C6.【单选题】在Spark运行时,()为程序构建基本运行环境Sparkcontext对象(应用管家),向资源管理器进行资源申请,任务分配与监控。ADriverprogramBSparkEnvironmentCDAGSchedulerDTaskScheduler正确答案:A我的答案:C7.【多选题】RDD的两种主要操作类型是()。AMapBTransformCReduceDAction解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。BD我的答案:D8.【多选题】MapReduce执行的全过程包括以下几个主要阶段()。A从分布式文件系统读入数据B执行Map任务输出中间结果C通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务D执行Reduce任务得到最终结果并写入分布式系统文件正确答案:ABCD我的答案:C9.【多选题】以下属于Spark的特点的有()。ASpeedBConciseCIn-memoryprocessingDLazyEvaluation正确答案:ABCD我的答案:C10.【判断题】Shuffle过程分为Map端的操作和Reduce端的操作。()正确答案:正确我的答案:正确7大数据安全与隐私保护1.【判断题】K-匿名规则满足子集属性和泛化属性。()正确答案:正确我的答案:正确2.【多选题】计算k-匿名的算法分类包括()。A基于泛化和基于元组抑制的算法B基于全局和基于局部记录的算法C基于层次和基于划分的算法D基于集合枚举和基于格搜索的算法正确答案:ABC我的答案:C3.【判断题】熵l-多样性满足子集属性和泛化属性。()正确答案:正确我的答案:正确解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。【多选题】关于隐私保护技术,以下描述正确的包括()。AK-匿名的局限性是容易遭受同质性攻击BL-多样性的局限性是容易遭受相似性攻击CT-相近比K-匿名和L-多样性有更强的隐私保护性能DK-匿名无法保证敏感值缺乏多样性正确答案:ABCD我的答案:B5.【多选题】下列哪些信息可能会侵犯用户的隐私()。A搜索引擎的搜索记录B浏览器的访问痕迹C电商平台的购物记录D地图应用的搜索记录正确答案:ABCD我的答案:C6.【判断题】蒙德里安算法是一种基于划分的算法。()正确答案:正确我的答案:正确7.【单选题】数据匿名化的原因有哪些()。A实现数据共享发布,而不泄漏用户的隐私B防止数据被篡改C压缩数据的存储空间D实现数据清洗正确答案:A我的答案:D8.【判断题】递归(c,l)-多样性不满足泛化属性。()正确答案:错误我的答案:正确9.【多选题】下列哪些方法可以实现匿名化()。A元组抑制B属性泛化C属性置换D属性扰乱正确答案:ABCD我的答案:B解忧书店,严禁转载,违者必究!/13:..青春须早为,岂能长少年。【判断题】极小全域泛化的集合构成一个反链。()正确答案:正确我的答案:正确8大数据技术应用1.【单选题】在“看不见的动机中”由于数据使用者和数据生成机构都是()的生产大数据,忽略了人们行为背后趋利避害的动机的大数据统计分析。A无意识B有意识C自主选择D趋向选择正确答案:A我的答案:A2.【多选题】大数据面临的挑战包括()。A大数据自大B算法演化C数据来源少D看不见的动机正确答案:ABD我的答案:B解忧书店,严禁转载,违者必究!/13