|

第一个提出大数据概念的公司是( )。
A:麦肯锡公司
B:谷歌公司
C:微软公司
D:脸谱公司
数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
以下哪项不是数据可视化工具的特性()
A:实时性
B:简单操作
C:更丰富的展现
D:仅需一种数据支持方式即可
以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
SAN是一种()
A:存储设备
B:专为数据存储而设计构建的网络
C:光纤交换机
D:HBA
下列不属于商业大数据类型的是
A:传统企业数据
B:机器和传感器数据
C:社交数据
D:电子商务数据
数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
IaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
医疗健康数据的基本情况不包括以下哪项?
A:诊疗数据
B:个人健康管理数据
C:公共安全数据
D:健康档案数据
大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
医疗大数据的来源主要包括()
A:制药企业/生命科学
B:临床医疗/实验室数据
C:费用报销/利用率
D:健康管理/社交网络
常见的分类方法有
A:决策树
B:贝叶斯网络
C:遗传算法
D:FP算法
离群点检测的应用包括()等。
A:欺诈检测
B:入侵检测
C:故障检测
D:疾病的不寻常模式
可使用##,##,##进行光滑。
A:最大值
B:箱中位数
C:箱边界
D:箱均值
百度大脑包括()
A:深度学习
B:超大规模机器学习
C:大规模GPU并行化平台
按照数据量的大小,可将数据分析分为()
A:内存级数据分析
B:Bl级数据分析
C:海量级数据分析
D:巨量级数据分析
大数据在医疗中的应用有()
A:流行性疾病预防
B:慢性病健康管理
C:临床决策支持
D:医疗器械研发
互连网上出现的海量信息可以划分为三种,分别为( )
A:结构化信息
B:非结构化信息
C:半结构化信息
D:特殊化信息
##和##,它们把原数据变换或投影到较小的空间。
A:小波变换
B:中心化变换
C:主成分分析
D:对数变换
社会信号数据的特点有()
A:规模大
B:空间覆盖率广
C:监测时间长
D:实时性
大数据存储的特点与挑战有()
A:容量问题
B:延迟问题
C:安全问题
D:成本问题
数据预处理的过程主要是
A:数据清洗
B:数据集成
C:数据变换
D:数据规约
大数据四大特征包括( )
A:数据量大
B:数据类型繁多
C:数据价值密度相对较低
D:处理速度快,时效性要求高
下列属于传统统计学展示方法的是()
A:柱状图
B:饼状图
C:曲线图
D:网络图
医疗领域如何利用大数据
A:临床决策支持
B:个性化医疗
C:社保资金安全
D:用户行为分析
Pentaho是最流行的开源商业智能软件之一
A:对
B:错
基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。
A:对
B:错
属性构造是由给定的属性构造和添加新的属性,帮助提高准确率和对高维数据结构的理解。
A:对
B:错
数据规模大,难理解,分析过程离不开可视化技术,可视化将贯穿于大数据分析与结果展示的全过程,可视化己经成为很多领域研究的议题。
A:对
B:错
原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。
A:对
B:错
累加器只有驱动程序才能读取
A:对
B:错
我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用
A:对
B:错
用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
A:对
B:错
NAS代表的意思是网络附加存储
A:对
B:错
数据流要表现出流数据的特征,反映的是系统中流动的数据;
A:对
B:错
关联分析又称为关联规则学习
A:对
B:错
数据存储和处理不是大数据发展面临的挑战
A:对
B:错
图表列表视图显示了传播图的拓扑关系
A:对
B:错
箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度 量,标准偏差、方差等可变性度量。
A:对
B:错
城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整。
A:对
B:错
通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的预防工作,帮助政府实现农业的精细化管理和科学决策。
A:对
B:错
数据可根据产生主体的不同分为两类:少量企业应用产生的数据和量个人用户产生的数据
A:对
B:错
通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。
A:对
B:错
大数据分为“结构化数据“与”非结构化数据”和“半结构化数据”。
A:对
B:错
原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。
A:对
B:错
|
|