阿凡达

案例CO包替代物:owerower

As network traffic continues to grow due to higher bandwidth applications, such as AI/ML (Artificial Intelligence/Machine Learning), high-resolution video streaming and virtual reality, the strain placed upon data center networks continues to increase.  These insatiable demands for more bandwidth are resulting in higher speed and higher density optics and ASICs.  The aggregate throughput of switch and optics devices is doubling every two to three years, which ultimately results in doubling the speed and increases in power of the host to pluggable optics electrical interface.  Unfortunately, while Moore's Law continues to allow us to scale our chips and equipment (despite non-trivial technical challenges), its corollary, Dennard Scaling, has been dead for a while.  This means the power required for the new generation of switch and optics semiconductors is higher than the previous one.

对CiscoWebscale数据中心客户来说,这有多重意义。要继续扩展围绕固定电源预算搭建的典型数据中心,计算和联网必须跟上这些新带宽需求,但与前置相同电源封套或面临昂贵升级

计算空间中, 保留固定功率预算的要求强制更改 :

  • 从单核向低频多极CPUs移动
  • 从通用CPU向焦点加速器GPUs(处理单元)移动,用于AI/ML推理培训等应用

网络空间中 数据中心地形折中 保留在所需电源封套中 我们必须重新考虑如何设计设备

然而,在我们持续寻找创新设计时,我们需要继续创新共包光学应用

三叉式CO包

支柱#1-调出级ds

切换系统速度和密度增高后,前端板插件耗用系统功率百分比也增高以25G/lane速度加速使用主动dSP重定时器的必要性拉动系统电量

组合光学学的关键创新之一是移动光学离开ACIC死线足够近,允许去除附加DSP(见图1)。

支柱#2-远程光源

在传统插件光学中,光学所有子组件都分布在插件模块中光学类离ACIC接近时,光学组件分治是一个关键决策。 激光对高温高度敏感,放入热环境时故障率会提高(例如:紧邻热开关ACICI)移动激光从高功率ACICI移到系统底盘内冷凉器位置

  1. 激光可被动冷却到低温,使其能够更有效地生成光电/Watt系统电源,调低系统电源,而没有像tEC(热电冷却器)这样的有效组件
  2. 激光从底盘上替换激光是光学子系统最不可靠的组件,使光源从系统前端面板无障碍易插入和清除对确保CPO系统与遗留系统相似MTBF(平均故障间隔时间)很重要
  3. 业界可规范远程光源表单因子和设计,允许多供应商采购[ELSFP行业标准管理协议CiscoOCC演示是使用行业标准表因数的第一个系统演示

支柱3-生产验证硅光学平台

光学组件非常接近开关ACICI死时,需要二级微量化(100x以上)对现有的插件模块使用。要做到这一点,许多先前分离ICCs(TIA、驱动器、调制器、Mex/demux)必须合并到单IC上。Cisco硅光学技术

图2-4OSFP800对Cisco3.2TCPO模块

在这个供应链挑战时代,选择拥有可靠技术的伙伴非常重要Cisco在CPO空间的长处之一是经验开发、优化和载运数以百万计的硅光学模块

Cisco 106.25Gbps/laneSlicenicsSISCAP调制器[1a]驱动芯片测量pam453gbaud从第二代scap和驱动

CPO系统参考摘要

通过这些创新,连接开关ACIC与前端板插件所需的功率可下降50%,结果固定系统总功率下降25-30%

图4-51.2T系统功率从插件减到CPO

CISCO反控CO-包化Objectics

Cisco自豪地展示下几步-并排比较实际功耗

  • Cisco 8111-32EH,传统32端2x400G1RU路由器满载2x400G-FR4插件模块(64x400GFR4)
  • CiscoCPO路由器全套单片光片驱动64x400GFR4
图5-思科OCC2023CPO Demo系统

关键应用

CiscoOCC2023演示突出Cisco技术开发的一些关键长处

综合硅光学Mux/Demux为400GFR4

共包光学挑战之一是要求小化光学组件以适应ACIC包件(比常规QSFD-DD或OSFP模块小100x以上)。这需要光学学和打包创新

任何CPO架构必须提供弹性支持所有数据中心光学类型,包括使用并行单模式纤维类型,例如4x100GDR4和CWDM400GFR4

400GFR4使用四种不同波长光线表示四大波长并发

Cisco发明了一种创新方法,用硅光学IC实现mex/demux

图6-400GFR4模块块图

多模块同时运行

开关ACIC包件光瓦集成化需要包机设计创新(以确保机械可靠性)、电源传输(向开关ACIC和小面积光瓦交付电流)和热冷却(消除高电密度)。

Cisco演示全套光瓦

增强热设计允许传统空气冷却

光学与开关ACIC整合的另一个挑战是系统总功率下降,系统中心热密度增长,因为光学从前端面板移到ACIC打包

其它商家使用液冷却管理高热密度

Cisco与关键伙伴合作开发高级热汇技术,允许继续使用传统可靠空气冷却,而不是强迫客户改变基础设施支持液冷却

CISCO对CO包化替代物(CPO)的正确选择

Cisco确认CPO技术的潜在利益并投资确保我们准备接受不可避免的过渡

系统供应商和网络操作员在大规模部署启动前必须解决极复杂问题。例如,它必须可靠、可用、可部署、提供大量节能并具有成本效益。这就是我们在OCC测试的原因。 Cisco期望试部署与51.2Tb切换周期同时并发,随后在101.2Tb切换周期中大规模应用

问题不在于相加光学 何时发生Cisco拥有系统、ACICs和光学知识,这使得它成为少数能成功实施并部署卷积全套光学的公司之一。 我们仍然致力于为这一不可避免的过渡投资,但现实化地说它可能仍然有距离。

你可以访问我们Cisco Silicon一号网站深入了解产业引导路由并交换硅架构你可以访问我们思科光学网站深入了解插件光学提供和硅光学技术


参考文献:

[1]travaso等综合硅光学传输器IEE Xplore,2022年8月17日

[2]Welch等人,面向400GBASE-FR4基准建议,IEEE2019年3月



作者类

阿凡达

安东尼图尔扎

杰出硬件工程师

公用硬件组