《计算机体系结构》复习题
一、填空题
1. 推动计算机系统结构发展的主要动力是(   计算机应用   )。
2. (   器件   )的发展是促使计算机系统结构不断发展的最活跃因素。
3. 衡量计算机系统性能可采用各种尺度,但最为可靠的衡量尺度是(  时间   )。 4. CPI表示执行每条指令所需的(   平均时钟周期数   )。
5. 计算机系统中的数据表示是指可由硬件直接辨认的(   数据类型    )。
6. 在向量处理中经常会遇到稀疏向量,为了节省存储空间和处理时间( 压缩向量  )的表示方法。
7. 在当今的RISC机的指令系统中,全都是(   定字长  )指令格式。
8. 增强向量流水处理性能的方法主要有:多功能部件并行操作和采用(  链接  )技术。 9. 数组多路通道与设备之间的数据传送的基本单位是(  数据块   )。 10. 数据流系统结构是基于数据驱动和(   消息传送  )的计算模型。
11. 现代计算机系统是由( 硬件/固件 )和( 软件 )组成的十分复杂的系统。
12. 计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即( 采用系列
机  ),(  仿真和模拟  ),统一高级语言。
13. 可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即( RM结构  )、( RR结构 )和存储器-存储器型指令集结构。
14.MIPS指令DADDIU R14,R5,#6属于( I )类型的指令格式;
MIPS指令SD R4,300(R5)属于(  I  )类型的指令格式。
15.描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示( 时间 ),纵坐标代表( 空间或流水线各段 )。 16.在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:( Load )和( ALU )指令。
17.存储器的层次结构中,“Cache-主存”层次是为了弥补主存( 速度 )的不足,“主存-辅存”层次是为了弥补主存(  容量  )的不足。 18.Cache实现的映像规则有全相联映像、(  直接  )和( 组相联 )三种。 19.反映存储外设可靠性能的参数有可靠性、( 可用性 )和( 可信性  )。
20.根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表了一种存储器的结构和互连策略。第一类机器称为( 集中式共享性 )结构,第二类机器具有( 分布的物理存储器 )。 二、单项选择题
1.计算机系统结构的外特性是指(  C  )所看到的外特性。 A.  应用程序员                        B.高级语言程序员 C.  机器语言程序员或编译程序编写者    D.包括以上各级程序员
2.计算机系统的描述:T{CRAY-1}={1,12*8,*(1-14)},说明该系统流水段为( D ) 。  A.12          B.8          C.        D.1-14
3.计算机系统设计任务之一,在满足功能要求基础上,进行设计优化,优化的主要衡量
第 1 页 共 7 页
指标是(  B  )。
A.  硬件简化程度  B.  编程开销    C.  降低成本    D.  性能价格比
4.用软件方法可在一台现有的计算机(甲)上实现另一台计算机(乙)的指令系统,通常把乙机称为(  B  )。
A.宿主机      B.虚拟机      C. 目标机    D. 系统机
5.统计计算机性能测试结果有多种方法,其中(  C  )最接近CPU的实际性能。
A. 算术性能平均值    B.几何性能平均值  C. 调和性能平均值    D.峰值性能指标 6.在设计指令系统时应注意:指令中各个不同含义的字段之间,在编码时应互相、互不相关。即(  A  )原则:
A.正交性      B.规整性     C.对称性     D.可扩充性
7.采用先行控制技术需增设一些缓冲部件,这些缓冲部件的深度之间存在的关系是(  A  )。
A.D指缓≥D操作数≥D读栈≥D写栈  B.D操作数》D指缓≥D读栈≥D写栈 C.D读栈≥D写栈≥D指缓≥D操作数   D.D读栈≥D写栈≥D操作数≥D指缓 8.用动态再定位形成访存物理地址的方法是在(  B  )时进行的。 A.程序装入    B.程序执行    巳程序编译    D.程序连接 9.Cache存储器地址映象算法中,(  C  )所需硬件最少。
A.段相联映象法    B.组相联映象法    C. 直接映象法      D.全相联映象法 10.特别适合于打印机等低速设备的总线数据宽度为(  D  )。
A. 可变长块    B.定长块      C. 单字加定长块  D.单字(或单字节) 11.中断系统采用(  C  )性能最佳。
A. 全硬件实现    B.全软件实现     C. 软硬结合    D.并行结构 12.如果快表采用堆栈替换算法,则(  A  ),其命中率越高。 A. 快表容量大      B.快表查找速度快  C. 快表用全硬件实现     D.快表用软硬结合实现
13.在数据流计算机中,一条指令能否执行的主要依据是(  D  )。   A.PC程序计数器所指定    B.操作数地址形成   C. 下一条指令已准备好    D.操作数全部到达 14.基于需求驱动和共享数据的计算模型是(  B  )。 A.串归约系统结构    B.图归约系统结构 C. 数据流系统结构    D.传统的系统结构 15.以下叙述中,错误的是(  B  )。
A.采用分布式存储器以MIMD方式工作的多机系统将成为并行机发展的主流趋向 B.系列机具有相同系统结构,兼容机具有不同系统结构 C. “先读后写”数据相关只会出现在异步流动流水线中 D.归约机系统结构采取的是种滞后求值策略 三、名词解释
第 2 页 共 7 页
1、 模拟
答:是指用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(虚拟机)的指令集。通常用解释的方法来实现。 2、 数据表示
答:机器硬件能够直接识别、指令系统可以直接调用的那些结构。确定操作数是软硬件取舍折中的问题。 3、 名相关
答:名是指令所访问的寄存器或存储器单元名称。如果两条指令使用相同的名,但是它们之间并没有数据流动,则称这两条指令存在名相关。 4、 互连网络
答:互连网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统中结点之间的相互连接。 5、 高可用性机群
答:当系统某些结点出现故障,仍能继续对外提供服务。当系统中某个结点由于软、硬件故障而失效时,该结点上的任务将在短时间内被迁移到机群内另一个具有相同功能与结构的结点上继续执行。
四、判断题
1、 从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中,第
2级是操作系统虚拟机,第3级是汇编语言虚拟机。( × )
2、 计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因素,
加快硬件周转而赢得时间。( × )
3、 指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指
令的CPI。( √ )
4、 指令条数多,通常超过200条,是设计RISC的原则之一。( × ) 5、 根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线性流
水线。( √ )
6、 在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。(× ) 7、 失效率和平均访存时间都可评价存储系统的性能,它们都和机器的硬件速度有关。
(× )
8、 RAID的特点有容量大,速度快、可靠性高,同时保存数据无冗余信息。(× ) 9、 在多处理机的互连网络中,交叉开关网络属于动态互连网络。(√ ) 10、 机群是一种价格低廉、易于构建、可扩缩性极强的并行计算机系统。(√ )
五、简答题
1、 简述标志符数据表示与描述符数据表示不同之处。
答:(1) 标志符要与每个数据相连,两者存在一个存储器单元中;而描述符则和数据
第 3 页 共 7 页
分开存放。(2) 要访问数据集中的元素时.必须先访问描述符,这就至少增加一级寻址(3) 描述符可看成是程序的一部分,而不是数据的一部分 2、 简述RISC采用的主要技术。
答:(1) 设置大量寄存器.并采用窗口重叠技术。 (2) 采用优化延迟转移技术。 (3) 采用比较转移指令。 (4) 采用优化编译技术。
3、 简述提高主存带宽的主要方法。
答:(1)增加存储器的数据宽度:即增加单体存储器中同时访问的数据量.从而提高吞吐率。(2)采用存储器的多体交叉技术,多个存储体作为存储器的并行模块,使总的数据吞吐率得到提高。
4、 简述向量流水线中,向量指令可以链接的前提条件。
答:1)不存在功能部件使用冲突。
(2)共用向量寄存器中的向量长度、起始地址,偏移量等均要相等。
(3)只有在前一指令第一个分量送人结果向量寄存器的那个时钟周期方可链接。  (4) 要求有关功能部件的延迟时间相等,即先行的两条指令产生结果的周期相等。 5、 计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?
答:Flynn分类法是按照指令流和数据流的多倍性进行分类的。把计算机系统的结构分为单指令流单数据流(SISD)、单指令流多数据流(SIMD)、多指令流单数据流(MISD)、多指令流多数据流(MIMD)。 6、 指令集应满足哪几个基本要求?
答:对指令集的基本要求:完整性、规整性、高效性、兼容性。完整性:在一个有限可用的空间内,对于任何可解的问题,编制计算程序时,指令集所提供的指令足够用。规整性主要包括对称性和均匀性。高效率:指指令的执行速度快、使用频率高。
7、 简述流水线技术的特点。
答:1)流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个的功能部件,并依靠它们的并行工作来提高吞吐率。
(2)流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。 (3)流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。 (4)流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。
(5)流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。
8、 简述通道完成一次数据传输的主要过程。
第 4 页 共 7 页
答:(1)在用户程序中使用访管指令进入管理程序,由CPU通过管理程序组织一个通道程序,并启动通道;
(2)通道处理机执行CPU为它组织的通道程序,完成指定的数据I/O工作。通道处理机执行通道程序是与CPU执行用户程序并行的;
(3)通道程序结束后向CPU发中断请求。CPU响应这个中断请求后,第二次进入操作系统,调用管理程序对I/O中断请求进行处理。
六、计算题
(一)试比较在不同计算机系统中。计算下列表达式所需时间。其中,加法需要40ns,乘法需要90ns。
1. 若在具有一个通用PE(处理单元)的SISD计算机中,数据传送时间忽略不计,计算该表达式所需时间T是多少? 答:(1)进行8次乘法、7次加法,全部顺序进行。 所需时间T=8*90ns+7*40ns=loons=1us
2. 若在SIMD计算机中,具有8个PE,PE间以线性圆环方式互连(以单向方式传送数据),试分析该机计算上述表达式时的具体步骤及用于乘法和加法的时间开销。 答:(2)8次乘法可同时进行;7次加法中分三步顺序进行:
第一步:4次加法并行;第二步:2次加法并行;第三步:1次加法。 时间开销T运算=90ns+3*40ns=210us
所以:T=T运算+T传递=210ns+70ns=280ns
3. 在上述具有8个PE的SIMD计算机中,数据由一个PE(处理单元)传送到另一个PE
需要10ns,计算该表达式所需全部时间是多少?
答:(3)由于PE间的以线性圆环互连,且为单向传送数据,乘法时PE间不需要传送数据,加法时第一次PE间相邻,第二次PE间隔为2,第三次PE间隔为4, 即 T传递=0+10ns+2*10ns+4*10ns=70ns。 所以:T=T运算+T传递=210ns+70ns=280ns (二) 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示:
操作类型 操作1 操作2 操作3 操作4 程序中的数量 (百万条指令) 10 30 35 15 改进前的执行时间 (周期) 2 20 10 4 改进后的执行时间 (周期) 1 15 3 1 (1)改进后,各类操作的加速比分别是多少?
(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少?
第 5 页 共 7 页
解 根据Amdahl定律Sn=1/[(1-Fe)+Fe/Se]可得如表1.4所示的4类操作的加速比
和
程
序
获
得
的
加
速
比
。
4类操作均改进后整个程序的加速比为 Sn=1/[(1一∑Fi)+∑(Fi/Si)]≈2.15 解根据Amdahl定律Sn=1/[(1-Fe)+Fe/Se]可得如表1.4所示的4类操作的加速比和程序获得的加速比。4类操作均改进后,整个程序的加速比为Sn=1/[(1一∑Fi)+∑(Fi/Si)]≈2.15
(三) 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t,其余各段的时间均为△t,而且流水线的输出可以直接返回输入端
4(AiBi),画出其时空图,或暂存于相应的流水寄存器中。现要在该流水线上计算             i1并计算其吞吐率、加速比和效率。
第 6 页 共 7 页
1 △t 加法 2△t △t △t 2 △t 3 乘法 4 5
由图可见,它在18个△t时间中,给出了7个结果。所以吞吐率为TP=7/18△t 如果不用流水线,由于一次求积需3△t,一次求和需5△t,则产生上述7个结果共需(4×5+3×3)△t=29△t。所以加速比为S=29△t/18△t≈1.61
该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得E=(4×5+3×3)/(5×18)≈0.322
第 7 页 共 7 页