单机柜内多运算板并行跑矩阵乘法。
汪涵选了一个oxo的矩阵乘法。
先测单块运算板的时间。
钱兰敲了命令,运算板开始计算。
终端机上跳出一个计时器,二十几秒后显示结果:“秒。”
然后测全机柜块运算板并行。汪涵加载了任务调度微程序,把矩阵拆分成个区块,分配给块运算板同时计算。
终端机上的计时器重新开始,数字跳动得比刚才快得多。
“o秒。”吴国华读出数据。
加比:除以o,约倍。
陈茂林的声音从身后传来:“再测一次。”
又测了一次。o倍。
再测一次。倍。
三次平均过倍,略优于设计指标的倍。
理想情况下,个单元并行,任务平均分配、无通信开销,昆仑的加比应当是倍。
但这是不可能的,因为还存在通信开销、总线竞争、负载不均等损耗。
双核心冗余测试紧随其后。
两台主控机柜,一台是主核心,一台是辅核心。两台机器跑着同样的微程序,结果实时比对。
吕辰走到陈茂林面前:“陈工,请您下令‘模拟主核心故障’。”
陈茂林看了他一眼,走到主控机柜前面,伸出手,按住了第一台机柜的电源开关。
“嘭”的一声,第一台主控机柜断电了。所有指示灯瞬间熄灭。
几乎在同一瞬间,第二台主控机柜的黄色“接管”指示灯亮了,绿色的“运行”灯没有灭。
终端机屏幕上的任务输出没有中断,连光标都没有闪烁一下。
示波器捕捉到了切换的时间波形。
这章没有结束,请点击下一页继续阅读!
吴国华看着屏幕:“切换时间约o毫秒,在毫秒以内。”
陈茂林把第一台机柜的电源重新推上,它重新启动,黄色指示灯变成了“待命”状态。
整个过程,正在运行的矩阵乘法任务没有报错,没有中断,甚至没有延迟。
宇文坤德站在机柜后面,手里攥着螺丝刀,指节白。
他看着那台被断电机柜重新亮起来的指示灯,长长地吐了一口气。
最后的考验:全系统满负荷运行。
这是昆仑机第一次以完整形态亮相。
台机柜全部在线,颗芯片同时工作,oo多块板卡各司其职。
其中存储系统由台机柜、个抽屉、颗kl-sra芯片构成,总主存容量b。
算例是魏知远教授团队提前准备好的:一个大型热传导方程的数值模拟,网格规模xx,需要做三维fft、矩阵求逆、oo次迭代求解。
这个算例如果在数字孪生实验室的机房跑,台午马机组成的集群一起力,以单台午马机每秒万次的算力,通信瓶颈限制,o效率下,耗时四天左右。
今天要在昆仑上跑。
卫知南把二维卡塞进读卡机。
读卡机开始咔嗒咔嗒地响,微程序被一行一行地加载到主控核心。
“加载完成。开始运行。”
终端机屏幕上开始滚动迭代步数。
第步、第o步、第o步、第oo步……
数字跳得很快,快到肉眼几乎跟不上。
吕辰看了一眼墙上的挂钟,下午五点二十三分。
机房的空调负荷骤增,散热风扇的嗡鸣声比平时大了许多。
秦无功走到机柜后面,用手背试了试水冷板的温度,回头朝吕辰点了点头。
迭代步数在滚动,所有人都没有说话,只是看着屏幕。
汪涵坐在终端前面,搬了把椅子,就那么坐着,一动不动。
宇文坤德靠在墙角,烟叼在嘴里没点。
吴国华站在机柜前面,双手插在裤兜里,眼睛盯着那排绿色的指示灯。