陈工笑了:“环状网令牌传递,台全部通过。”
第四阶段:混合拓扑全连通测试。
星型网和环网同时连接。
台机器运行“全对全向量求和”算法,每台机器通过星型网向存储柜写入自己的初始值,再读取所有其他节点的值累加;同时通过环网与左右邻居交换数据计算边界差。
所有节点最终都计算出全局和o,边界差验证正确。
监控终端上个方块全部显示“运行”,中央存储柜指示灯闪烁得比昨天更快。
大约五分钟后,所有节点的显示器上同时出现:
localsus=o,verifetpass
boundarydiffverifetpass
hybridologytest:pass
陈工写道:“混合拓扑全连通测试通过。”
第五阶段:容错与压力测试。
这是最漫长的阶段,也是最暴露问题的阶段。
先做节点离线测试。
孙班长走到七号机后面,拔掉电源插头。
七号机的显示器瞬间熄灭,风扇停止转动。
监控终端上七号机的绿色方块变成红色,旁边出现一行字:“nodeoffledetected”。
不到一秒钟,其他十五台机器的显示器上都打印出了“nodeoffle”的警告。
吕辰看了一眼时间:“响应度合格。”
孙班长把电源插回去,机器重新启动,自检通过,自动加入环网。
监控终端上的方块从红色变回绿色。
然后是存储柜端口故障测试。
孙班长走到中央存储柜后面,拔掉五号机的星型网线。
五号机的显示器上正在运行的程序突然报错:“starduorkreaderror”。
监控终端上五号机的方块从绿色变成黄色,旁边出现“nodestoraaessfailed”。
吕辰在本子上记:“故障检测正常。”
接下来是环网断线测试,这是整个联调中唯一出现逻辑不直观的地方。
孙班长走到八号机和九号机之间,拔掉了那段同轴电缆。
这一次,故障不是立即全面显现的。
环网上的令牌还在跑,但跑到八号机的时候,不出去了。
八号机的显示器上出现一行字:“tokentiout,noresponsefronode”。
与此同时,九号机也检测不到左邻的信号,同样显示时。
而十号机、十一号机等下游节点,则在各自等待了一段时间后陆续报出时,因为令牌永远到不了它们那里。
监控终端上,从八号机到十五号机的方块全部变成了黄色,分别写着“tiout”或“notoken”。
本小章还未完,请点击下一页继续阅读后面精彩内容!
只有零号到七号机还保持绿色,它们虽然收不到返回的令牌,但尚未判定自己失联。
陈工盯着屏幕看了一会儿,用手指点了点八号和九号之间的位置:“断点在这里。八号不出,九号收不到,下游全部时。”
孙班长把电缆接回去。
大约两秒钟后,令牌重新开始在环网上流动,所有节点的状态陆续恢复绿色。
吕辰在本子上写:“环网断线测试,故障定位准确,恢复自动完成。”
然后是最关键的并压力测试。
所有节点同步开始,同时向存储柜写入数据。
每个节点连续写oo次,每次写一个带节点id和序号的数据块。
写完之后,再读取所有写入的数据,检查有没有缺失或错乱。
第一次压力测试运行了大约十分钟。
节点零汇总结果时,显示器上出现了一行字: