|

大数据的最显著特征是() 。
A:数据规模大
B:数据类型多样
C:数据处理速度快
D:数据价值密度高
下列哪个R语言扩展包可以创建带有点和边的网络图()
A:ggplot2
B:network
C:ggmaps
D:animation
下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chubby
C:结构化数据表BigTable
D:弹性云计算EC2
基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
MapReduce中的Map和Reduce函数使用()进行输入输出
A:key/value对
B:随机数值
C:其他计算结果
用于描述相等时间间隔下连续数据随时间变化趋势的是()
A:折线图
B:散点图
C:条形图
D:饼图
GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
IaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据
C:社交数据
D:电子商务数据
主流分布式计算平台有()
A:google
B:IBM
C:baidu
D:Amazon
一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
关于R语言扩展包下列正确的是()
A:network可创建带有点和边的网络图
B:animation可制作一系列的图像并将它们串联起来做成动画
C:ggmaps通过树图来可视化层次型数据
D:protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
大数据在电信中的应用有
A:基于用户、业务及流量分级的多维管控机制
B:精准的客户分析及营销
C:利用位置和轨迹信息服务社会
去除噪声使得数据光滑的技术主要有:
A:分箱
B:回归
C:离群点分析
大数据在医疗中的应用有()
A:流行性疾病预防
B:慢性病健康管理
C:临床决策支持
D:医疗器械研发
医疗大数据的来源主要包括()
A:制药企业/生命科学
B:临床医疗/实验室数据
C:费用报销/利用率
D:健康管理/社交网络
下列正确的是()
A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C:D3采用的是Selectors API的第一级标准
D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。
按照数据量的大小,可将数据分析分为()
A:内存级数据分析
B:Bl级数据分析
C:海量级数据分析
D:巨量级数据分析
基于大数据的临床决策支持系统的架构包括
A:支撑层
B:大数据分析层
C:网络层
D:应用层
常见的非结构化数据有()
A:web网页
B:即时消息
C:富文本文档
D:实时多媒体数据
统计图表的可视化方法主要包括()
A:散点图
B:折线图
C:条形图
D:饼图
离群点检测的应用包括()等。
A:欺诈检测
B:入侵检测
C:故障检测
D:疾病的不寻常模式
层次方法可以分为()
A:K均值算法
B:K中心点算法
C:凝聚法
D:分裂法
常见的分类方法有
A:决策树
B:贝叶斯网络
C:遗传算法
D:FP算法
广义的Spark是指Spark生态系统,采用了四层架构。
A:对
B:错
数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。
A:对
B:错
数据会吸引更多的潜在攻击者,成为更具吸引力的目标。
A:对
B:错
数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量
A:对
B:错
FP是一种最有影响的挖掘布尔关联规则频繁项集的算法
A:对
B:错
百度地图春节人口迂徙大数据.在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。
A:对
B:错
空间视图提供了交通堵塞的概览
A:对
B:错
基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。
A:对
B:错
通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。
A:对
B:错
数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A:对
B:错
HDFS为海量的数据提供了存储;
A:对
B:错
美国《自然》(Nature)杂志专刊——The next google,第一次正式提出“大数据”概念。
A:对
B:错
弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。
A:对
B:错
云存储中用户需要按需付费并使用存储服务
A:对
B:错
宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
A:对
B:错
非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值
A:对
B:错
内存分析数据量比BI分析数据量大
A:对
B:错
数据存储要表现出静态数据的特征,反映的是系统中静止的数据。
A:对
B:错
属性或维命名的不一致也可能导致结果数据集中的数据冗余。
A:对
B:错
多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面
A:对
B:错
|
|