超前自学网

 找回密码
 立即注册

奥鹏在线作业,2元一门,先做后付,微信424329

查看: 128|回复: 0

20春学期(1709、1803、1809、1903、1909、2003)《并行程序设计》在线作业

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
95816
发表于 2020-10-30 14:00:51 | 显示全部楼层 |阅读模式
微信公众号:超前自学网
点击这里

定期评选全球计算能力最强的超级计算机的国际组织是____。
A:top500
B:green500
C:graph500
D:super500

Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?
A:SISD
B:SIMD
C:MISD
D:MIMD

编写n个数求和的OpenMP程序,最高效的方法是____。
A:多线程直接并发累加到共享变量
B:将累加操作设置为临界区
C:在累加操作前设置障碍
D:采用归约指令

n个处理器、n个内存模块的交叉开关构造成本为____。
A:O(logn)
B:O(n)
C:O(nlogn)
D:O(n^2)

在共享内存架构编程中,线程间不能通过____进行通信
A:全局变量
B:局部变量
C:静态变量
D:全局堆中变量

每个AVX寄存器宽度为____位。
A:32
B:64
C:128
D:256

采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
A:3
B:4
C:5
D:6

OpenMP循环划分策略不包括____。
A:static
B:fixed
C:dynamic
D:guided

对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?
A:1
B:10
C:100
D:300

____不是SIMD架构。
A:SSE
B:超线程
C:AltiVec
D:Neon

AVX有____个专用寄存器。
A:4
B:8
C:16
D:34

在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
A:初始化
B:阻塞
C:继续执行
D:销毁

Neon是____平台的SIMD架构。
A:x86
B:POWER
C:SPARC
D:ARM

一个SSE寄存器可容纳____个短整型数。
A:2
B:4
C:8
D:16

SSE intrinsics _mm_load_pd命令的功能是____。
A:对齐向量读取单精度浮点数
B:未对齐向量读取单精度浮点数
C:对齐向量读取双精度浮点数
D:未对齐向量读取双精度浮点数

对双精度浮点计算,AVX最高实现____路并行。
A:2
B:4
C:8
D:16

OpenMP并行模型是一种____模式。
A:静态线程
B:对等式多线程
C:加锁-解锁
D:Fork-join

通常忙等待方法的性能要比互斥量方法的性能____。
A:更高
B:更低
C:高低不确定
D:以上皆错

在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
A:初始化
B:第二个矩阵转置循环
C:矩阵元素乘—加计算的循环
D:结果输出

多对多广播/归约高效算法基于____。
A:递归思想
B:流水线思想
C:分治思想
D:贪心思想

对于向量化,以下说法错误的是____。
A:总会有打包/解包开销
B:若运算对象连续存储,可消除打包开销
C:若运算结果连续存储,可消除解包开销
D:打包/解包开销由数据存储决定

现代CPU中都具有指令乱序执行功能,其目的不包括____。
A:消除指令依赖,更充分利用多流水线
B:提高cache效率
C:改变计算结果
D:消除资源冲突

传统科学和工程实验相对于计算机并行仿真的劣势不包括____。
A:成本太高
B:结果不准确
C:时间太长
D:太危险

为了充分利用CPU内的多条流水线,程序应满足____。
A:相邻指令无依赖性
B:相邻指令相互依赖
C:整段程序中指令无依赖性
D:整段程序中指令相互依赖

pthread_create函数中设置一个参数为“线程函数参数”的原因是____。
A:它调用线程函数时可直接传递,性能更优
B:它需要预处理之后传递给线程函数
C:线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数
D:没有特别用意

天河1号、天河2号、神威.太湖之光总体上都是____架构
A:单核
B:多核
C:众核
D:集群

如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。
A:对齐
B:打包
C:解包
D:以上皆错

每个SSE寄存器宽度为____位。
A:32
B:64
C:128
D:256

pthread_sem_post是对信号量进行____操作。
A:加锁
B:解锁
C:加1
D:减1

一个Neon寄存器最多存放____个整型数。
A:2
B:4
C:8
D:16

在用pthread_mutex_trylock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
A:初始化
B:阻塞
C:继续执行
D:销毁

当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A:部分并行算法
B:所有并行算法
C:所有并行算法都不
D:以上皆错

实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是____。
A:omp parallel
B:omp barrier
C:omp critical
D:omp reduce

动态任务划分相对于静态任务划分的缺点是____。
A:可能导致负载不均
B:通信开销高
C:任务粒度粗
D:计算复杂度高

pthread_join的第二个参数的作用是____。
A:设置指定线程属性
B:获取指定线程属性
C:向指定线程传递参数
D:获取指定线程函数返回结果

关于OpenMP循环并行程序的编写,下列说法中正确的是____。
A:程序员需要编写线程创建和管理代码
B:程序员需要编写循环划分代码
C:程序员需要编写调度策略代码
D:程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么

SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。
A:将第一个源寄存器的第j个元素放在目标寄存器位置0
B:将第二个源寄存器的第j个元素放在目标寄存器位置0
C:将第一个源寄存器的第j个元素放在目标寄存器位置j
D:将第二个源寄存器的第j个元素放在目标寄存器位置j

对于条件变量,下列说法错误的是____。
A:可以用互斥量实现相同功能
B:不能用互斥量实现相同功能
C:较之互斥量方案节省资源
D:较之互斥量方案代码更简洁

在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
A:输入数据
B:中间结果
C:输出数据
D:临时数据

为持续提高CPU性能,以下说法正确的是____。
A:只需不断增加器件集成密度
B:只需不断提高频率
C:必须利用并行技术
D:只需提高功耗

对于搜索分解,下面哪个说法是错误的_____。
A:所有子树搜索任务都必须全部完成
B:工作量可能大于串行计算
C:工作量可能小于串行计算
D:可能产生超线性加速比

一个AVX寄存器最多存放____个短整型数。
A:2
B:4
C:8
D:16

在使用信号量之后必须对其进行____。
A:初始化
B:解锁
C:减1
D:销毁

起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
A:增大了元素比较距离
B:减小了元素比较距离
C:改为元素两两分组比较
D:消除了元素比较

下面说法错误的是____。
A:不存在权威的并行体系结构
B:学习并行程序设计只关心软件即可
C:并行体系结构对性能有巨大影响
D:很多并行体系结构未来发展不明了

在条件不成立时,使用pthread_cond_wait____。
A:令线程阻塞
B:解锁互斥量
C:解锁互斥量然后令线程阻塞
D:加锁互斥量

关于MPI是什么,以下说法错误的是____。
A:一种消息传递编程模型标准
B:一种共享内存编程模型标准
C:编程角度看是C  /Fortran等的库
D:基于SPMD模型

使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。
A:0
B:1
C:2
D:4

CUDA的优点不包括____。
A:可移植性
B:入门简单
C:标准的SPMD模式
D:不再需要图形API

将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
A:_mm_set_ps
B:_mm_set1_ss
C:_mm_setzero_ss
D:_mm_setzero_ps

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|超前自学网 ( 皖ICP备20014425号-1 )|网站地图

GMT+8, 2025-5-1 05:48

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.. 技术支持 by 巅峰设计

快速回复 返回顶部 返回列表