|

应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
每个Region服务器存储
()个Region
A:1
B:10
C:10-1000
D:0
针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
Google Cloud SQL是谷歌公司推出的基于()的云数据库
A:MySQL
B:SQL Server
C:Hbase
D:Oracle
以下哪种属于列族数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
BigTable采用()作为底层数据存储
A:HDFS
B:GFS
C:Hbase
D:传统文件系统
UMP系通过()来实现实现管理每台物理机上的MySQL实例
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
以下亚马逊的产品中哪个是键值数据库
A:RDS
B:SimpleDB
C:DynamoDB
D:Redshift
以下亚马逊的产品中哪个是NoSQL数据库
A:RDS
B:SimpleDB
C:DynamoDB
D:Redshift
以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
词频计算就是典型的()运算。
A:关系连接
B:分组聚合
C:关系代数
D:矩阵
Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A:Master
B:Region
C:Zookeeper
D:Chubby
Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端
对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息
HDFS中FSDataInputStream封装了()
A:HDFSInputStream
B:DFSInputStream
C:DataInputStream
D:FSInputStream
很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
A:动态
B:存量
C:实时
D:静态
MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。
A:M
B:N
C:M-1
D:N-1
SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
Amazon Redshift属于()
A:关系数据库
B:键值数据库
C:NoSQL数据库
D:数据仓库
UMP系统借助于()来实现集群内部的负载均衡
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper
以下说法不正确的是()。
A:MapReduce的核心思想就是“分面治之”
B:HDFS是对GFS的开源实现
C:MapReduce是一种分布式计算模型
D:HDFS采用HBase作为其底层数据存储
以下哪个不属于MongoDB的特点
A:提供了面向文档的存储
B:可以设置任何属性索引
C:具有很好的垂直可扩展性
D:支持丰富的查询表达式
信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A:信息处理
B:信息增长
C:信息爆炸
D:信息传输
NoSQL中的CAP理论中的P代表()
A:一致性
B:可用性
C:分区容忍性
D:可扩展性
批处理系统关注(),流处理系统关注()。
A:吞吐率,延时
B:延时,吞吐率
C:延时,速度
D:速度,吞吐率
MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A:Client
B:Job Tracker
C:Task
D:Task Tracker
以下属于Hadoop2.0的特性是()。
A:MapReduce
B:HDFS
C:YARN
D:SPARK
MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A:数据向计算靠拢
B:计算向数据靠拢
C:计算向网络靠拢
D:计算与数据并行
大数据的特征是()。
A:数据体量大
B:数据产生速度快
C:数据种类多
D:数据计算快
E:数据价值高
关系数据库与NoSQL数据库相比有哪些优势()
A:支持事务ACID四性
B:可以支持超大规模数据存储
C:以完善的关系代数理论作为基础
D:具有强大的横向扩展能力
流计算系统的需求有()。
A:实时性
B:廉价
C:高性能
D:高带宽
E:分布式
哪些属于数据可视化的重要作用()
A:分析数据
B:采集数据
C:辅助理解数据
D:观测跟踪数据
以下亚马逊的产品中哪个属于计算部分
A:EC2
B:EBS
C:S3
D:ELB
以下哪个不是云数据库的特点
A:高可扩展性
B:高可用性
C:支持资源有效分发
D:本地存储
流计算是针对流数据的实时计算,可以应用在()场景中
A:广告投放
B:气候模拟预测
C:机器翻译
D:推荐系统
以下哪些是数据可视化分析工具()
A:R
B:Weka
C:Gephi
D:Tableau
以下哪些是数据可视化地图工具()
A:Google Fusion Tables
B:Modest Maps
C:Leaflet
D:Google Chart API
以下亚马逊的产品中哪个属于存储部分
A:EC2
B:EBS
C:S3
D:ELB
数据产生方式的运营式系统阶段的数据产生方式是主动的。
A:对
B:错
传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。
A:对
B:错
对于每个顶点而言,Pregel只保存一份顶点值和边值,但是,会保存两份“标志位”和输入消息队列,分别用于当前超步和下一个超步
A:对
B:错
云数据库不可以满足企业动态变化的数据存储需求
A:对
B:错
Ambari通过Web进行Hadoop集群的管理配置。
A:对
B:错
在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位
A:对
B:错
Facebook主要将Hadoop平台用于日志处理、推荐系统等方面
A:对
B:错
大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。
A:对
B:错
Hbase和传统数据库一样都是列式数据库
A:对
B:错
HBase只有一个索引——行键,通过巧妙的设计,HBase中的所有访问方法,或者通过行键访问,或者通过行键扫描,从而使得整个系统不会慢下来
A:对
B:错
|
|