一、 选择题
⒈ 对系统程序员不透明的应当是 。
A Cache B 系列机各档不同的数据通路宽度 C 指令缓冲器 D 虚拟存储器 ⒉ 计算机系统结构不包括 。
A 主存速度 B 机器工作状态 C 信息保护 D 数据表示 ⒊ 属于计算机系统考虑的是 。
A 主存采用MOS还是TTL B 主存采用多体交叉还是单体结构 C 主存的编址方式 D 主存频宽的确定
⒋ 从计算机系统结构上来看,机器语言程序员所看到机器属性是 。 A 计算机软件所要完成的功能 B 计算机硬件所要完成的功能 C 编程要用到的硬件组织 D 计算机各部件的硬件实现 ⒌ 系列机软件应做到 。
A 向后兼容,力争向上兼容性 B 向前兼容,力争向上兼容性 C 向后兼容,力争向下兼容性 D 向前兼容,力争向下兼容性 ⒍ 利用时间重叠概念实现并行处理的是 。 A 多处理机 B 相联处理机 C 并行(阵列)处理机动性 D 流水处理机 ⒎ 计算机中优化使用的操作码编码方法是 。 A 霍夫曼编码 B ASCII 编码 C 扩展操作码 D BCD码 ⒏ 程序员编程时使用的地址是 。
A 物理地址 B 主存地址 C 有效地址 D 逻辑地址 ⒐ 块冲突率最高的cache地址映象方式是 。 A 组相联 B 直接相联 C 段面相联 D 全相联 ⒑ 影响流水线最大吞吐率是 。
A 各个功能段的时间 B 最快功能段的时间
C 最慢功能段的时间 D 最后一个功能段的时间 ⒒ 非线性流水线是指 。
A 一次运算中使用流水线中的多功能段 B 一次运算中多次使用流水线中的某些多功能段 C 流水线中某些功能段在各次运算中的作用不同 D 流水线的各功能段在各种运算中有不同的组合 ⒓ Cache地址映象中块冲突率最低的是映象是 。 A 全相联 B 页相联 C 直接相联 D 组相联
⒔有8个结点的PM2I单级网络的PM2-0(j)=(j-20)mod 8=
A (7 6 5 4 3 2 1 0) B (0 1 2 3 4 5 6 7) C (7 5 3 1) (6 4 2 0) D(0 2 4 6) (1 3 5 7)
⒕有8个结点的PM2I单级网络的PM2+0(j)=(j+20)mod 8=
A (7 6 5 4 3 2 1 0) B (0 1 2 3 4 5 6 7) C (7 5 3 1) (6 4 2 0) D(0 2 4 6) (1 3 5 7) ⒖能实现作业、任务级并行的异构型多处理机属于 。
A SIMD B SISD C MIMD D MISD ⒗下列说法正确的是 。
A 一次重叠是一次解释一条指令 B 一次重叠是同时解释相邻两条指令 C 流水方式是同时只能解释两条指令 D 一次重叠是可同时解释多条指令 ⒘通道程序执行结束后引起的中断是 。
word文档 可自由复制编辑
A I/O中断 B 程序性中断 C 内中断 D 机器校验中断 ⒙打印机适合连接在 。
A 数组多路通道 B 字节多路通道 C 选择通道 D 任意一种通道 ⒚disk适合连接在 。
A 数组多路通道或选择通道 B 字节多路通道 C 数组多路通道或字节多路通道 D 任意一种通道 ⒛
21.通道程序执行结束后引起的中断是 。
A 访管中断定 B I/O中断 C 外中断 D 程序性中断 22.利用时间重叠概念实现并行处理主是 。
A 流水处理机动 B 多处理机
C 相联处理机动 D 并行(阵列)机 23.数据表示是 一部分。
A 软件的 B 硬件的
C 软硬件交界面的 D 非软非硬的 24. 是促使计算机系统结构发展的最重要的因素 A 软件 B 硬件 C 固件 D 器件 25.计算机系统结构研究的范围不包括 。
A 指令系统的定义 B 计算机系统性能的评价 C 软硬件界面的定义 D 加法器的结构
26. 交换互连网(立方体结构)编号为011的PE的3个相邻PE的编号是 。 A 001,010,111 B 100,101,111 C 101,110,111 D 001,101,110
27. 交换互连网(立方体结构)编号为000的PE的3个相邻PE的编号是 。 A 001,010,111 B 100,101,111 C 101,110,111 D 001,010,100
28. 在Cache更新策略中,在Cache不命中时把数据同时写入Cache和MM的策略是 。
A 写回法 B 写直达法(全写法) C 按写分配法 D 不安写分配法 29. 在Cache更新策略中,在Cache不命中时把数据从MM调入Cache的策略是 。
A 写回法 B 写直达法(全写法) C 按写分配法 D 不安写分配法 30. 相关专用通路 。
A 解除数据相关性 B 减少数据相关引起的流水线停顿 C 解除控制相关性 D 不能缓解流水线的相关性问题 31. 开发粗粒度并行主要采用 。 P184 A 硬件手段 B 软件手段 C 软硬件同时并举 D 指令级并行
32. 开发细粒度并行主要采用 。 P184 A 硬件手段 B 软件手段 C 软硬件同时并举 D 作业级并行
33. SIMD结构主要实现的是的 。 P200
A 作业级并行 B 任务级并行
C 指令操作级并行 D 指令内操作步骤并行
34. MIMD结构主要实现的是的 。 P200 A 作业级并行 B 任务级并行
C 指令操作级并行 D 指令内操作步骤并行
35. 设计互连网络时应考虑的特征有 个。 P190 A 4 B 3 C 2 D 1
word文档 可自由复制编辑
36. 归约机按归约模型可分为 。
A 数值归约和串归约 B 串归约和图归约
C 数值归约和图归约 D 指令归约和数值归约
37. 模拟是采用 解决执行方法。
A 纯硬件 B 以软件为主,硬件为辅 C 纯软件 D 以硬件为主,软件为辅 38. 仿真是采用 解决执行方法。
A 纯硬件 B 以软件为主,硬件为辅 C 纯软件 D 以硬件为主,软件为辅
39. 对Amdahl提出关于计算机系统结构定义中所提到的“程序员”比较一致的看法是 。 A 机器语言程序员或编译程序员 B 应用程序员 C 高级语言程序员 D 任何程序员
40. RWC(真实世界计算机)计划的主要研究内容有 方面。 A 3 B 4 C 1 D 2
41. 在程序执行中有 个方面因素会引起顺序控制流发生变化。 P72 A 1 B 3 C 4 D 2
42 依数据令牌的不同数据流计算机可分为 两大类。
A 数值流和非数值流 B 静态和动态
C 数值流和图流 D 令牌流和非令牌流 二、填空
⒈程序的局部性包括 的局部性和 的局部性。
⒉CPU的Channel 输入输出指令的基本功能主要是: , 以及 。
⒊虚拟存储器对 程序员是透明的,对 程序员是不透明 的。
⒋通道按信息传送方式可分为 , , 三 类通道。
⒌设通道数据传送周期选择一次设备的时间为TS,传送一个字节的时间是TD,则传 送n个字节的选择通道的极限流量是fs.max= 。
⒍设通道数据传送周期选择一次设备的时间为TS,传送一个字节的时间是TD,则有 K台I/O设备的成组传送极限流量fB.max= ,
⒎在“一次重叠”解释时,第k条指令需等待第k-1条指令执行后才能形成,称此 时发生了 相关。
⒏在“一次重叠”解释时,第k条指令的源数据与第k-1条指令的结果数据的地址 一样,称此时 发生了 相关。
⒐多功能流水线各功能段同时只能按某一种功能联接的称为 流水线。
⒑多功能流水线各功能段同时可以按不同的运算或功能联接工作,此流水线称为
流水线。
⒒消除流水线速度瓶颈的方法有 和 两种方法。P81
⒓解决重叠和流水线中的操作数相关,不外乎是 和 两 种方法。P85
⒔系列机软件兼容必须做到向 兼容,尽可能争取向 兼 容。
⒕提高计算机系统并行性重叠的主要技术途径有时间重叠、 和 。
⒖多处理机可以有同构型、 和 三种。 ⒗多处理机有 和 两种基本构型。 ⒘并行性主要是指 和 两重含义。
⒙多处理机系统在系统结构上可分为 耦合和 耦合系 统。
⒚按连接方式分,流水线可分为 流水线和 流水线。
⒛按功能分类,流水线可分为 流水线和 流水线。
word文档 可自由复制编辑
21.评价存储器性能的基本要求是大容量、 和低价格。
22.解决重叠和流水中的操作数相关,有推后法和 两种方法。
23.从对执行程序或指令的控制方式上,将计算机系统分为由控制驱动的 流 和由数据驱动的 流方式,按 驱动的归约方式和模式驱动的匹配 方式。
24.流水线按工作方式可分为 流水线和 流水线。
25.流水线按处理级别可分为操作部件级、 级和 级三种。
26.根据处理数据令牌的不同,数据流机的基本结构可分为 和 两大类。 27.一个指令系统的设计主要是确定它的 、 、操作及对操作数的 访问方式。
28.对实现基本操作来讲,指令系统的不同只是反映在 和 不一样。 29.指令系统设计原则是应特别注意如何支持 、简易地将源程序翻译成 。
30.在指令系统设计时应注意 、 、 、 。 31.指令系统结构的分类主要是依据在CPU中以何种存储方式来存放操作数。 按照 这一特征,可将指令系统结构分为 型、 型、 型三类。 32.计算机应用对系统结构不断提出的最基本要求是 、 和 。
33.在RISC结构中为了减少过程调用中保存现场和建立新现场,以及返回时恢复现场 等辅助操作,通常将全部寄存器分成若干组,称为 。
34. 对实现基本操作来讲,指令系统的不同只是反映在 和 。P42 35. 一般指令系统由 和 两类指令组成。P42
36. 指令系统结构的分类主要是依据在CPU中以何种存储方式来存放操作数。 按照 这一特征,可将指令系统结构分为 、 和 型三类。P43
37. 通用寄存器型指令系统中,按照ALU指令有多少个个操作数需要到存储器中去存取,可以进一步分为 、 和
型三类。P44
38. 阵列机可分为两个基本结构, 和 。P185 39. 在数据流计算机中信息项以操作包和“数据令牌”形式出现,其中数据包由 , 和 组成。 P228
40. AI处理的基本要点是基本知识的 , 和 地加以利用。P242 41. “数据令牌”由 和 组成。 P228 42. 构成函数程序的主要成份是 、 和 。 P235 43. 人工智能研究的关键在于 和 。 P244 44. 阵列机通常由一个 、N个 M个 和
一个 组成。 P185 45. 存储器的命中率是 和 之比。 P128 46. 紧耦合系统按所用处理机类型是否相同,常见的组合可分为 和 两种基本构型。 P201
47. 在层次存储结构价格体系中命中判断和数据传输对较高层次而言应由 实现,对较低层次而言应由 实现。 48.依据处理数据令牌的不同,数据流机可分为 和 两在类。 P232
49.通常流水过程中会出现 、 和 三种相关。 P83 50. 数据相关冲突可分为 、 和 三种类型 P87 51. I/O控制操作:包括 、 。P158
三、计算
⒈假定要在一个时钟速率为40MHz的标量处理机上执行一个典型测试程序,该程序 中含有4种类型指令,每种指令的条数和每种指令的CPI如下所示:
指令类型 ALU Load/Store指令(Cache命中时) 指令数 120000 36000 CPI 1 2 word文档 可自由复制编辑
24000 转移指令 20000 访存指令(Cache不命中时) ① 计算在单处理机上执行该程序的平均CPI。 ② 根据①所得的CPI值,计算相应的MIPS速率。
⒉假定要在一个时钟速率为40MHz的标量处理机上运行具有200000条指令的目标代 码,程序中含有4种类型指令,根据程序实验结果,已知指令混合比和每种指令 的CPI如下所示:
指令类型 混合比 ALU 60% 18% Load/Store指令(Cache命中时) 12% 转移指令 10% 访存指令(Cache不命中时) ③ 计算在单处理机上执行该程序的平均CPI。 ④ 根据①所得的CPI值,计算相应的MIPS速率。
⒊某模拟机有10条机器指令,使用频度分别为:0.01,0.15,0.12,0.07,0.08, 0.13,0.15,0.03,0.17,,0.09。 ⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。
⒋某模拟机有7 条机器指令,使用频度分别为:0.04,0.04,0.05,0.06,0.15, 0.26,0.40。
⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。 ⒌有一个具有5个功能段组成的乘、加双功能的静态流水线,“乘”由1→2→3→4 完成,“加”由1→5→4完成,各段时延均为t(见下图),输出可直接返回输入 或存入缓冲存储器。现计算长度均为8的A、B两个向量对应元素求和的连乘积。 静态双功能流水线图
4 8 CPI 1 2 4 8 ⑴画出完成此运算的流水线的运行时空图; ⑵完成全部运算需要多少个t?其效率是多少? ★ 解:(共10分,时空图对了给3分。计算时公式对了而结果错了扣1分,公式错了全扣)
⑴时空图(4分)
⑵(6分,每个答案3分) TP=15/25Δt =3/5Δt E=(8×3Δt+7×4Δt)/(25×Δt)=52/125=0.416
⒍有一个具有4个功能段组成浮点加的静态流水运算器,各段时延均为t(见下图), 输出可直接返回输入或存入缓冲存储器。现以下述方式计算
word文档 可自由复制编辑
Z=[a+b]+[c+d]+[e+f]+[g+h]
⑴画出完成此运算的流水线的运行时空图; ⑵分析其吞吐率和效率。
⒎采用组相联映象的Cache容量为1KB,要求Cache的每一块能在1个主存周期内
从主存读取。主存结构是模4交叉,每个分体宽为32位,总容量为256KB。用按 地址访问访问存储器构成相联目录表实现主存地址到Cache地址的变换,并约定 用4路比较电路。请设计此相联目录表,求出该表行数、总位数和比较电路的位 数。
⒏对于一个有如下特征的虚拟存储系统: 40位虚拟地址 16KB页面 36位物理地址
① 每个进程的页表的总长度是多少?
② 假定TLB用两路组相联方式的Cache,块长为8个字(4B),总容量为16KB,写出其地址格式。 ⒐假设Cache的工作速度为主存的5倍,且Cache被访问的概率为90%,则采用Cache 后,整个存储系统获得多高的加速成比? 胡越明 P103
⒑某字节多路通道欲连接6台外设,其数据传输速率见下表。而通道选择设备时间 需9.8s,每个字节传送需0.2s,问通道能否胜任所有设备同时工作?
⒒设通道在数据传送期中,选择设备需4.9μs,传送一个字节数据需0.1μs。
① 其低速设备每隔250μs发出一个字节数据传送请求,问最多可接多少台这种设 备?
②若有A~E共5种高速设备,要求字节传送的时间时间如表,其时间单位为μs。
若一次通信传送的字节数不少于1024B,问哪些设备可挂在此通道?
⒓如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用向量方式 求解部分所花时间占总的时间的百分比为可向量化百分比。问为达到加速比为2, 可向量化百分比应是多少?
⒔某系统某一功能改进后其速度是原来的10倍,而该功能的处理时间仅为整个系统 运行时间的40%,则用此增强功能方法后,整个系统的性能提高多少?
⒕设二级虚拟存储器的TV1=10-7s,TV2=10-2s,若要求访问时间TV达到1ms,问访问 一级存储器的命中率应是多少?
⒖设Cache块为16字,对于下列2种MM结构:
⑴如果MM的访问延时为4个时钟周期,访存地址和1个字的传输时间各为1时钟个周期,数据传输后还需1个周期的恢复时间,问这两种MM结构在Cache访问失效时的块访问时间各是多少?
⑵假设Cache命中时的指令平均执行时间为1.2周期,平均每条指令访存时间为1.5次,Cache的命中命中率为99%,问这两种MM结构中指令的平均执行时间。
⒗设1个任务的处理时间为s,CPU在这段时间内始终忙于处理,I/O处理时间为 36s。为了提高系统性能,有两种方案:使CPU的速度增加1倍,或者使CPU和 I/O的处理速度同时增加1倍。计算这两种情况下的处理时间。
⒘设16 个处理器编号分别为0,1,…,15。采用单级互网互连,当互连函数分别为⑴ Cube3
⑵ PM2-3 ⑶Shuffle ⑷Btterfly ⑸Exchange
时第11号处理器各与哪一个处理器相连。
⒙设16个处理器编号分别为0,1,…,15。采用单级互网互连,当互连函数分别为⑴ Cube3
word文档 可自由复制编辑
⑵ PM2-3 ⑶Shuffle ⑷Btterfly ⑸Exchange
时第9号处理器各与哪一个处理器相连。
⒚某模拟机有7 条机器指令,使用频度分别为:0.01,0.01,0.03,0.05,0.15, 0.30,0.45。
⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。
⒛某模拟机有10条机器指令,使用频度分别为:I1:0.2,I2:0.12,I3:0.11,I4:0.05, I5:0.08,I6:0.03,I7:0.02,I8:0.18,I9:0.10,I10:0.01。 ⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。 胡越民书P123
21.某模拟机有10条机器指令,使用频度分别为:I1:0.2,I2:0.12,I3:0.11,I4:0.05, I5:0.08,I6:0.03,I7:0.02,I8:0.18,I9:0.10,I10:0.01。 ⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。
22.假定要在一个时钟速率为40MHz的标量处理机上执行一个典型测试程序,该程序 中含有4种类型指令,每种指令的条数和每种指令的CPI如下所示: 指令类型 指令数 ALU 45000 32000 Load/Store指令(Cache命中时) 15000 转移指令 8000 访存指令(Cache不命中时) ⑴计算在单处理机上执行该程序的平均CPI。 ⑵根据①所得的CPI值,计算相应的MIPS速率。 ⑶计算总的CPU执行时间TCPU。
23.某模拟机有9 条机器指令,使用频度分别为:I1:0.3,I2:0.24,I3:0.06,I4:0.07, I5:0.07,I6:0.02,I7:0.03,I8:0.2,I9:0.01 ⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。
24.一台流水计算机A的工作频率为25MHz,平均CPI为4。计算机B是A的改进型, 有一条5段的线性指令流水线,时钟频率为20 MHz。问:
⑴若在A和B两台计算机上执行含有100条指令的程序,则计算机B对A的加速 比是多少?
⑵在执行上述程序时,计算机A和B的MIPS速率各是多少? 25.某单功能非线性流水线的预约表如下: 1 2 3 5 4 6 S1 * * S2 * S3 * S4 * * ⑴写出禁止表F和冲突向量C。 ⑵画出该流水线状态图,确定其最佳调度方案和最小平均流水速率。 ⑶计算按此流水线调度方案执行8个任务所需的时间。
⑷计算按此流水线在执行8个任务时的吞吐率、加速比和利用率。 胡越明书P229 26.某单功能非线性流水线的预约表如下:
CPI 1 2 2 2 7 * word文档 可自由复制编辑
S1 S2 S3 S4 S5 1 * 2 * 3 * 4 * 5 * 6 * 7 * 8 * * 9 *
⑴写出禁止表F和冲突向量C。
⑵画出该流水线状态图,确定其最佳调度方案和最小平均流水速率。 ⑶计算按此流水线调度方案执行8个任务所需的时间。
⑷计算按此流水线在执行8个任务时的吞吐率、加速比和利用率。
27. 假定要在一个时钟速率为40MHz的标量处理机上运行具有200000条指令的目标 代码,程序中含有4种类型指令,根据程序实验结果,已知指令混合比和每种指 令的CPI如下所示:
指令类型 混合比 ALU 43% 21% Load/Store指令(Cache命中时) 24% 转移指令 12% 访存指令(Cache不命中时) ① 计算在单处理机上执行该程序的平均CPI。 ② 根据①所得的CPI值,计算相应的MIPS速率。
28 某台计算机只有Load/Store指令能对MM进行读/写操作,其他指令只能对寄存器 进行操作。根据实验的结果,已知每种指令所占的比例和CPI如下表所示:
CPI 1 2 2 2 CPI 指令类型 混合比 ALU 43% 1 21% 2 Load/Store指令(Cache命中时) 24% 2 转移指令 12% 2 访存指令(Cache不命中时) ① 计算上述情况的平均CPI。 ② 假设程序由M条指令组成,算术逻辑运算中,25%的指令两个操作数中的一个已在寄存器中,另一个必须在算术逻辑指令
执行前用Load指令从MM中读取到寄存器中。因此,有人建议增加另一种算术逻辑指令,其特点是一个操作数取自寄存器中,另一个操作数取自MM,即寄存器-存储器型。做假设这种指令的CPI等于2,同时转移指令的CPI变为3。求新指令系统的平均CPI。 胡越明P22
29.某计算机字长32位,包含两个选择通道和一个多路通道,每个选择通道上连接2 台磁盘机和2台磁带机,多路通道上连接2台行式打印机、两2台读卡机和10台 终端。假定各设备传输速率如下: 磁盘机:800KBps 磁带机:200KBps 行打机:6.6KBps 读卡机:1.2KBps 终端: 1KBps
求该计算机系统的最大I/O数据传输速率。 张春元P170
30. 一个字节多路通道连接有5台设备,它们的数据传输率如下表:
word文档 可自由复制编辑
设备名称 数据传输速率(KB/s) D1 100 D2 33.3 D3 33.3 D4 20 D5 10 ⑴ 计算这个字节多路通道的实际工作流量。
⑵ 为了使通道能够正常上作,请设计通道的最大流量和工作周期
31. 一个字节多路通道连接D1、D2、D3、D4、D5共5台,这些设备分别每10μs、30μs、30μs、50μs和75μs向通道发出一次数据传
送的服务请求。回答下列问题:
⑴计算这个字节多路通道的实际流量和工作周期。
⑵如果设计字节多路通道的最大流量正好等于实际流量,并假定对数据传输率高 的设备,通道响应它的数据传送请求助优先级也高。5台设备在0时刻同时向通 道发出第一次传送数据的请求,并在以后的时间里按照各自的数据传输率连续 工作。画出通道分时为各台设备服务的时间关系图,并计算这个字节多路通道 处理完各台设备的第一次数据传送请求的时刻。 ⑶从时间关系图上可以发现什么问题?如何解决这个问题? 解
⑴这个字节多路通道的实际流量为fbyte=(1/10+1/30+1/30+1/50+1/75)=0.2MB/s
通道助工作周期为t=1/ f=5μs/B,包括通道选择设备的时间Ts和为设备传送1 个字节所用的时间Td。
⑵5台设备向通道请求传送数据和通道为它们服务的时间关系如图所示。
向上的箭头表示设备的数据传送请求,有阴影的长方形表示通道响应设备的请 求并为设备服务所用的时间间隔,包括通道选择设备的时间和为设备传送一个 字节所用的时间,这两部分时间之和为5μs。
在图,5台设备在。时刻同时向通道发出第数据的请求.通道处理各个设备第一次请求时间如下:
处理完设备D1的第一次请求的时刻为5μs。 处理完设备D2的第一次请求的时刻为10μs。 处理完设备D3的第一次请求的时刻为20μs。 处理完设备D4的第一次请求的时刻为30μs。
设备D5的第一次请求没有得到响应,直到第85Ps通道才开始响应设备D‘的服务请求,这时,设备已经发出了2个传送数据
的服务请求,因此,第=次传送的数据有可能要丢失。
⑶由图可知,当字节多路通道的最大流量与连接在这个通道上的所有设备的数据流量之和非常接近时,如果传输速度高的设备频
繁发出服务请求,并且优先得到响应,那么某些低速设备可能在很长的一段时间内得不到响应。
32.—个4段的双输入端规格化浮点加法流水线(见下图),每段经过时问10ns,输出可直接返回输入或将结果暂存下相应缓冲器中。
word文档 可自由复制编辑
问最少需经多少时间能求出
i110ai:
⑴ 在下坐标中画出完成此运算的流水线的运行时空图(横坐标每小格代表10ns,纵坐标每小格代表1个功能段);(4分) y 0 x ⑵ 流水线从开始流入到结果流出这段时间的实际吞吐率TP和效率EP。(6分,每问3分) 答案
解:
⑴ 时空图(4分)
⑵ (6分)
TP=9/17△t EP=(46+34)/ (174)=36/68=52.9%
33. 有一个流水线由四段组成,其中每当流经第三段时,总要在该段循环一次才能流到第四段(见下图)。如果每段经过一次的时间都
是Δt,现连续输入10个任务,问:
⑴ 当在流水线的输入端每Δt时间输入任务时,该流水线会发生什么情况? {2分} ⑵ 画处理10个任务的时空图。(4分)
⑶ 求连续处理10个任务的实际吞吐率TP和效率EP。(4分,每问2分) 答案
word文档 可自由复制编辑
解:⑴ 产生流水线的阻塞(产生流水线的停顿或断流或不连续)(2分)
⑵ 时空图(4分)
⑶ (6分) TP=10/23△t期 EP=(103+102)/ (234)=50/92=54.35 %
34. 假设一台计算机的I/O处理占10%,当其CPU性能改进到原来的10倍时,而I/O性能仅改进为原来的两倍时,则加速比是多少? 答案
解:改进后I/O的运行时间是原来的1/2,CPU为原来的1/100。所以SP=1/(0.1/2+0.9/100)=16.94 35. 在一个4段的流水线处理机上需经7柏才能完成一个任务,其预约表如下表所示。 ⑴分别写出延迟禁止表F、冲突向量;
⑵画出流水线状态转移图,求出最小平均延迟及流水线的最大吞吐率及其调度时的最佳方案。 ⑶按此流水调度方案,输入6个任务.求实际的吞吐率。 时间 段号 t1 t2 t3 t4 t5 t6 t7 S1 S2 S3 S4 × × × × × × × × 答案
解:⑴ 禁止表F={2,4,6};初始冲突向量C=(101010)
⑵ 状态转移图
调度方案 (1,7) (3,5) (5,3) 5 平均延迟 4 4 4 5
最小的平均延迟为4拍。此时流水线的最大吞吐率Tpmax=1/4(任务/拍) ⑶①最佳调度方案宜选其中按(1,7)周期性助调度的方案
接(1,7)调度方案输入6个任务、全部完成的时间为 1+7+1+7+1+7=24(拍) 实际吞吐率Tp=6/24(任务/拍)
②若按(3、5)调度方案输入6个任务.全部完成的时间为 3+5+3+5+3+7=26(拍)
word文档 可自由复制编辑
实际吞吐率Tp=6/26(任务/拍)
③若按(3、5)调度方案输入6个任务.全部完成的时间为 5+3+5+3+5+7=28(拍) 实际吞吐率Tp=6/28(任务/拍)可见最传的方案应当为(1,7)调度方案。
36. 假设Tm是主存的R/W时间,Cache的工作速度为主存的5倍,且Cache访问命中的概率为90%,则 ⑴ 求平均访问时间。⑵ 采用Cache后,与单独使用主存比性能提高多少? (4分) 答案
解:
⑴ Cache的工作速度为主存的5倍。则Cache访问时间TC= Tm/5。 Ta=0.10×Tm+0.90×Tm/5=0.28 Tm (4分)
⑵ 性能为原来的1/0.28=3.57倍,即提高了2.57倍。(4分) 或用阿姆达尔定律求解:
Sp10.910.953.57
37. 下图给出了一个非线性流水线。若有4条指令依次间隔4Δt进入流水线。请画出时空图,并求出实 际吞吐率和效率。
若要使流水线每隔2Δt流出一个结果,应减少流水线上哪个功能段的经过时间?应减少到多少,方 能满足要求?(10分)
答案 解:解:(共10分,时空图对了给3分。计算时公式对了而结果错了扣1分,公式错了全扣) ⑴时空图:
⑵ 吞吐率Tp=4/(22Δt) 效率 =(38Δt+42Δt)/(422Δt)=40/88=5/11 将Ⅲ号功能段时时间减少为1Δt(或Ⅲ号功能段的总通过时时间为2Δt),方能满足要求。
38. 某模拟机有9 条机器指令,使用频度分别为:I1:0.3,I2:0.24,I3:0.06,I4:0.07,I5:0.07,I6:0.02,I7:0.03,I8:0.2,I9:0.01 (10分)
⑴写出等长操作码编码的平均码长; ⑵构造霍夫曼树;
⑶写出只有两种码长的最短的霍夫曼扩展编码及其平均码长。
答案
解:解:(共10分,霍夫曼树编码不唯一,但平均码长的计算结果是唯一的,计算时公式对了而结果错了扣1分;公式错了全扣) ⑴等长操作码平均码长为4位。 ⑵霍夫曼树
word文档 可自由复制编辑
所以霍夫曼编码:
I1:10,I2:00,I3:1110,I4:1101,I5:1100,I6:111110,I7:11110,I8:01,I9:111111 平均码长:2(0.30+0.24+0.2)+4(0.06+0.07+0.07)+50.03+6(0.02+0.01)=2.61 ⑶只有两种编码的最短霍夫曼扩展编码是
I1:00,I2:01,I8:10,I3:11000,I4:11001,I5:11010,I6:11011,I7:11100,I9:11101 平均码长:2(0.30+0.24+0.2)+5(0.01+0.02+0.03+0.06+0.07+0.07)=2..74
四、 回答问题
⒈硬件和软件在什么意义上是等效的?在什么意义上又是不等效的? ⒉计算机系统结构的定义是什么?软件移植途径有哪些?
⒊计算机系统的Flynn分类法是按什么来分类的?共分哪几类? ⒋将16进制数(8C5A3E00)16转换为等值的十进制数。 ⒌通道分哪3种类型?简述各自的工作原理?
⒍CPU写Cache时,会发生Cache与主存的对应复本内容不一致的现象,有哪些解决 方法?简述这些方法是如何解决Cache与主存的对应复本内容不一致的。 ⒎什么是静态数据流计算机?什么是动态数据流计算机? ⒏多处理机与并行处理机与流水线机有什么不同? ⒐人工智能计算机有哪些特征? ⒑程序中数据相关性有哪几种?
⒒简述指令系统设计的基本思想。 P42 ⒓简述指令系统设计原则和注意事项。 ⒔简述MIMD与SIMD有什么不同? ⒕简述需求模型工作原理。
⒖什么是归约机? P235 ⒗简述并行性的开发策略 P184 ⒘I/O子系统的性能衡量标准包括哪些? P179
⒙I/O处理机的主要工作是什么? P178
⒚简述并行程序设计设计语言的开发方法。哪种方法较为现实?P211 ⒛简述数据流计算机机工作原理。 P228
word文档 可自由复制编辑
21.流水线操作中有会出现哪几种相关? P83
22. 简述多核处理器的主要优点。陆鑫达著 第2版P338 23. 简述多核处理器的思想。陆鑫达著 第2版P338
24. 在CRAY-1机上,设向量长度均为32,所用浮点功能执行部件的执行时间分别为:加法需 6拍,相乘需7拍,从存储器读数需6拍,打入寄存器及启动功能部件(包括存储器)各需 1拍。问下列指令组中指令是否可以链接?哪些指令可以并行执行?试说明其原因并分别计 算出指令组全部完成所需的拍数。
V0←存储器
V3←V1+V2
V4←V0*V3
V6←V4+V5
25. 在 CRAY-1 向量流水处理机上,加法流水线处理时间为 6 拍,乘法为 7 拍,取数为 6 拍、求倒数为 14 拍、寄存器写入及启动
功能部件各需一拍。问下列各指令组中哪些指令可以链接?哪些指令不可链接?哪些指令可以并行执行?试说明原因并分别计算各指令组运算所需的时间,假设向量长度均为 32。
V0←存储器
V1←V2 + V3 V4←V5 * V6
★答:三条指令可并行执行:执行时间 = 1+7+1+31 = 40 (流水周期)
26. 在CRAY-1向量流水处理机上,加法流水线处理时间为6拍,乘法为7拍,取数为6拍、求
倒数为14拍、寄存器写入及启动功能部件各需一拍。问下列指令组中哪些指令可以链接?哪些指令不可链接?哪些指令可以并行执行?试说明原因并分别计算各指令组运算所需的时间,假设向量长度均为32(8分,每问2分)
V0←存储器 V3←V1+V2 V4←V0*V3 存储器←V4
★解:指令1,2条指令互不相关且处理时间相同,而与第3条指令相关,则第1,2条指令并行。
第1,2条指令与第3条可链接。 而指令4与指令3存在相关,可链接执行;
执行时间=(1+6+1)+(1+7+1) +(1+6+1)+31=56 (流水周期)
word文档 可自由复制编辑
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务