超前自学网

 找回密码
 立即注册

奥鹏在线作业,2元一门,先做后付,微信424329

查看: 102|回复: 0

20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(一)》在线作业

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
95816
发表于 2020-10-30 12:56:16 | 显示全部楼层 |阅读模式
微信公众号:超前自学网
点击这里

Modest Maps是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具

UMP系统借助于()来实现分布式数据库服务
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper

Hbase中采用()保证系统出错时及时恢复
A:MemStore
B:Hlog
C:StoreFile
D:客户端

以下亚马逊的产品中哪个是数据仓库
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift

HDFS中ClientProtocal的()方法可以查找下一个数据块
A:getBlock
B:getBlockLocations
C:getLocation
D:nextBlock

对于不同顶点之间的信息交换,Pregel采用了()
A:远程数据读取
B:共享内存
C:纯消息传递模型
D:共享消息

UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器

批处理系统关注(),流处理系统关注()。
A:吞吐率,延时
B:延时,吞吐率
C:延时,速度
D:速度,吞吐率

()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A:DistributedFileSystem
B:GFSSystem
C:FileSystem
D:HDFSSystem

UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器

列式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL

应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库

UMP系统借助于()来实现高效和可靠的协同工作
A:Mnesia
B:LVS
C:RabbitMQ
D:Zookeeper

UMP系统中面对分库分表用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例

Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping

关于Hadoop集群网络拓扑,以下说法错误的是()。
A:普通的Hadoop集群结构由一个两阶网络构成
B:Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器
C:在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和
D:一般来说机架内部网络环境比机架间网络环境好

Gephi是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具

MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A:数据向计算靠拢
B:计算向数据靠拢
C:计算向网络靠拢
D:计算与数据并行

Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping

以下哪个是HDFS的局限性()。
A:吞吐率
B:数据集
C:兼容性
D:延迟

HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A:Master
B:Region
C:Zookeeper
D:Chubby

优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库

MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A:Client
B:Job Tracker
C:Task
D:Task Tracker

Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping

Hbase中主服务器Master主要负责表和Region的管理工作
A:Master
B:Slaver
C:Region
D:客户端

以下哪个是通过JDBS和关系数据库进行交互的()。
A:Ambari
B:Oozie
C:Hive
D:Sqoop

UMP系通过()来实现实现管理每台物理机上的MySQL实例
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器

()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A:NameNode
B:SecondaryNameNode
C:DataNode
D:Block

Hbase中Zookeeper可以帮助选举出一个()作为集群的总管
A:Master
B:Slaver
C:Region
D:客户端

Pregel计算模型以()作为输入
A:有向图
B:无向图
C:矢量图
D:树

以下哪个不是云数据库的特点
A:高可扩展性
B:高可用性
C:支持资源有效分发
D:本地存储

以下哪些属于典型的大数据应用()。
A:谷歌搜索
B:谷歌流感趋势
C:谷歌统计
D:《纸牌屋》制作
E:《黑镜子》制作

MapReduce可以解决哪些计算问题()。
A:矩阵乘法
B:关系代数运算
C:聚合运算
D:关系投影运算

流计算系统的需求有()。
A:实时性
B:廉价
C:高性能
D:高带宽
E:分布式

以下属于Hadoop的安装方式的有()。
A:单机模式
B:多机模式
C:分布式模式
D:并行模式
E:伪分布式模式

已得到广泛应用的分布式文件系统主要包括()。
A:GFS
B:MapReduce
C:Hbase
D:HDFS

Hbase中Zookeeper提供了()
A:分布式同步
B:组服务
C:域名服务
D:配置维护

关系数据库与NoSQL数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析

NoSQL数据库与关系数据库相比有哪些优势()
A:支持事务ACID四性
B:可以支持超大规模数据存储
C:以完善的关系代数理论作为基础
D:具有强大的横向扩展能力

流计算处理流程三个主要阶段是()。
A:实时采集
B:实时存储
C:实时计算
D:实时查询

HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
A:对
B:错

HDFS使用的是传统的分级文件体系,因此,用户可以像使用普通文件系统一样,创建、删除目录和文件,在目录间转移文件,重命名文件等
A:对
B:错

云数据库不可以满足企业动态变化的数据存储需求
A:对
B:错

HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
A:对
B:错

MapReduce中TaskTracker使用“slot”等量划分本节点上的资源量。
A:对
B:错

云数据库不可以满足大企业的海量数据存储需求
A:对
B:错

HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留
A:对
B:错

HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
A:对
B:错

Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
A:对
B:错

Hbase中表在垂直方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
A:对
B:错

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|超前自学网 ( 皖ICP备20014425号-1 )|网站地图

GMT+8, 2025-5-1 09:36

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.. 技术支持 by 巅峰设计

快速回复 返回顶部 返回列表