论文部分内容阅读
随着集成电路制造工艺的进步和半导体技术的发展,传统的二维芯片的设计越来越复杂,通信成本不断提高。三维集成技术缩短了物理连线的长度,降低了系统的通信时延和功耗,成为芯片架构发展的主要趋势之一。另一方面,作为一种主流的集成电路片上通信架构,片上网络克服了总线技术的瓶颈,将计算机网络技术移植到芯片设计中,提高了多核SoC(system-on-chip)芯片和多处理器芯片的可扩展性。然而,三维集成电路的复杂度和集成度持续提高,极大影响了三维片上网络的通信效率,并致使网络中部件的故障发生概率也相应增高。本文面向资源开销敏感的三维集成芯片研究片上网络可靠路由方法,主要关注三维片上网络中常见且不可恢复的永久性故障,其中包括链路故障和路由器故障等。本文取得了以下创新性研究成果: 1、提出了一种三维片上网络的轻量级细粒度可靠路由方法,能够有效地容忍三维mesh片上网络中的永久性路由器故障。 路由器是片上网络通信中的核心部件。由于其结构比较复杂,通常某些功能模块发生永久性故障后,并不影响其他模块的使用。已有相关工作中将故障路由器整体挂起停用的做法会造成本已紧缺的片上资源的巨大浪费。本文选择路由器中占据绝大部分面积、更容易发生永久性故障的数据通路上的交叉开关作为功能细化对象,首先设计出一种高可靠性的路由器微体系结构Re-MA,并提出一种与之匹配、基于逻辑的轻量级路由算法LBDRem。同时,本文提出了一种有助于平衡网络负载的三维转向模型Full-OE引导LBDRem。最后,本文采用一种新的端口选择机制DP-3D帮助数据包在传输过程中避开网络热区,以降低通信时延。实验的数据对比表明,针对三维mesh网络中的永久性路由器故障,本文所提可靠路由方法相比于同期最新的国际同类工作,可以在不显著增加系统实现成本的基础上获得最多27.9%的通信可靠性提升。 2、提出了一种三维片上网络的单向递进式可靠路由方法,能够有效地容忍三维mesh片上网络中的永久性垂直链接故障。 在三维mesh片上网络中,硅通孔(TSV)技术目前较低的制造工艺良率和使用过程中的老化现象会导致水平器件层之间的垂直链接发生永久性故障的几率大大增加。之前已有方法无法较好地适应复杂的网络故障情形,很难保证网络通信的性能和可靠性的需求。本文采用直观的单向逐层递进式路由策略,在三维mesh结构网络中,首先选取当前数据包所在水平器件层的中间节点(α规则),然后通过提出的水平路由算法DyADM和端口选择机制NoP-3D控制数据包绕过故障垂直链接并传输至直接下游器件层,直至到达目的节点,完成网络通信任务。其中,DyADM算法由本文提出的一种三维转向模型(β规则)引导。实验的数据对比表明,针对三维mesh网络中的永久性垂直链接故障,本文所提可靠路由方法相比于同期最新的国际同类工作,可以在不显著增加系统实现成本的基础上获得最多47.4%的通信可靠性提升。 3、提出了一种非规则三维片上网络的无回路可靠路由方法,能够有效地容忍非规则三维片上网络中的永久性链接故障。 在工业界的三维多核SoC芯片中,处理单元一般都采用异构方式设计,非规则的三维片上网络在产品设计需求中很常见,并具备常见拓扑结构网络所没有的通信特点。已有的方法很难在低成本的前提下保证网络通信的性能和可靠性。本文引入图论中的经典概念——汉密尔顿路径和生成树,分别根据各自的特点设计了相应的路由算法,并同时运用到可靠路由方法的设计中。在网络中存在汉密尔顿路径时,选择基于汉密尔顿路径的路由算法;在网络中不存在汉密尔顿路径时,选用生成树路由算法。此外,本文采用了新的端口选择机制DP-3D,用于避开网络通信热区、降低通信时延。实验的数据对比表明,针对非规则三维片上网络中的永久性链接故障,本文所提可靠路由方法相比于同期最新的国际同类工作,可以在不显著增加系统实现成本的基础上获得最多33.9%的通信可靠性提升。 4、提出了一种转向模型引导的无线三维片上网络可靠路由方法,能够有效地容忍无线三维片上网络中的永久性垂直无线链接故障。 无线技术可以拓宽原有基于金属线传导技术的传输带宽,降低数据包通信时延和功耗,已成为片上网络连接技术的发展趋势之一。已有工作仅在三维网络中的水平器件层内或水平器件层间引入无线技术进行相关研究,本文设计了一种兼顾水平器件层内和水平器件层间无线连接技术的三维片上网络架构。同时,本文采用直观的单向逐层递进式路由策略,先选择数据包当前所在器件层的中间节点,然后基于器件层内传统金属线和无线射频技术通过提出的最短路径路由算法和端口选择机制DP-3D控制数据包绕过垂直无线链接故障并传输至直接下游器件层,直至到达目的节点,完成网络通信任务。其中,最短路径路由算法由本文提出的一种公平且限制宽松的三维转向模型NeoOE引导。实验的数据对比表明,针对无线三维片上网络中的永久性垂直无线链接故障,本文所提可靠路由方法相比于同期最新的国际同类工作,可以在不显著增加系统实现成本的基础上获得最多64.2%的通信可靠性提升。