当我推开舷窗遮光板,清晨第一缕阳光将云海染成温暖的橙色,照在我的脸上微微发烫,一如我此刻雀跃的内心。2018年春天,刚从剑桥大学博士毕业的我,告别了康河的柔波,奔向华为,开始在网络研究部从事预研工作。
2019年底,公司刚开始进军汽车行业,因为业务连续性受到影响,许多芯片受到限制。当历史把我们推向全新赛道的拐点时,为了支撑华为第一款车载网络芯片的研发,同时解决园区以太芯片业务连续性的难题,我所在的园区与车载以太网技术团队成立了。
与其说是团队,倒不如说是我与方李明两个人的组合。作为数字信号处理领域的“三好学生”,我们一边写代码、搭样机,一边赶紧招兵买马。几个月后,算法小能手邹聪仕、稳重博士穆童、数通“库尔曼”牛海强、“总裁奖”拿到手软的李莹和“行走的产品经验数据库”吴悦峰纷纷加入进来。
我们成功集齐了一群志同道合的“最强大脑”,开始了艰难的攻关之旅。
一场突破10倍的技术挑战
2021年,我们团队临危受命,接到“10G电口PHY(网口内收发器芯片)技术突破”的任务。这款芯片曾被业界称为“the ultimate copper PHY(究极铜线PHY芯片)”,其芯片技术是领域内算法最复杂的技术之一。因功耗过高、性能无法达成传输要求,尝试攻克该难题的公司最终均以失败而告终,至今为止,全世界仅有A国的两家公司成功量产。
我们日常使用电脑后端的插线网口,常用的速率是1Gbps(比特每秒),而10Gbps的网口多在数通企业Wi-Fi AP(接入点)、交换机上大量使用,但都是采用的国外芯片。当前国内厂家能够量产的芯片最高速率仅为2.5Gbps,为了保障业务连续性,我们不得不想办法将网口数据传输速率从1Gbps提升至10Gbps。这是一场突破10倍的技术挑战,若无法完成技术突破,我们将面临款型缺失的风险,因此必须设计出10G网口收发器芯片的低功耗算法,让它的性能和功耗都能满足产品指标,并支持商用。
但由于网线的信道环境恶劣、传输距离远,想要将10Gbps速率的信号在网线上传递100米的距离后,再将失真的信号恢复回来非常困难。就好比我们想通过一台高倍望远镜看风景,要达到的技术水准需满足无论多远距离都能看到清晰画面,这需要使用非常复杂的数字信号处理算法。
“已经有太多团队在这块芯片上折戟,要想成功恐怕很难。”面对这种大概率失败的局面,大家神色担忧,“承接这个项目,风险还是太大了” 。
“业界已经有两家标杆有成功经验,况且我们华为又有这么优秀的团队,试试吧!” 我鼓励道。面对即将断供的局面,我们只能破釜沉舟。
然而,比起鼓励团队成员时的云淡风轻,每当深夜来临时,我安静地坐在工位前,时常陷入迷茫。“在战略上藐视项目,在战术上就要重视项目。”我也给自己打打气。作为项目“领头羊”,我开始进行整体布局和分工。
考虑到之前的团队有过失败经历,我向他们了解了具体情况,想先按照自己的思路来设计,好试探试探这个项目的真正难度。当我结合了历史经验并根据自己的思路设计了算法并搭建了仿真平台后,发现使用传统的算法虽然能实现10Gbps的技术突破,但是功耗极高。预计在相同工艺下,每端口功耗会比TOP厂商高出1至2W。这种功耗差距放在48口交换机上,会多出约50到100W的功耗。一个小功率电磁炉在保温时的功率大约是100W,这就相当于用交换机热米饭一样。客户机房里通常需要放置多台交换机,如果功耗问题不解决,就像机房里多放了几十个电磁炉同时在工作。当我用自己的方式尝试一番后,所面临的结果和历史上失败的原因一致:“功耗太高,无法商用”。
为了节省带宽并传播更远的距离,10GPHY是一个“同时同频全双工”的系统,我们传统的光纤或者无线通信中,上下行的信号都会通过时间或频率做出区分。然而,在同时同频全双工的系统中,上下行的信号使用相同的时间以及相同的频率,它们完全是混在一起的。就像发射机自己发出的信号会被自己接收到,并形成干扰。这就需要设计算法将自身的干扰抵消掉,这种抵消算法会占用大量的面积功耗。
此外,算法的设计过程中还需要考虑现网的部署。在实际的网络中,不仅有华为的设备,也会有其他厂家不受控的设备,网线还会将环境中的干扰耦合进来,这些干扰都有可能影响通信的质量。
经过一个多月的攻关,我们意识到,仅仅凭借当前团队的五个人难以解决这个难题。
“华为在海外有个专家团队或许能有办法。”当时的数据通信研究部部长钱骁得知我们遇到瓶颈后,向我们引荐了专家团队。他们有着丰富的经验,是我们能够找到的、距离这款芯片“最近的人”。于是,我们很快便与海外专家团队建立合作,组建了一支跨国团队向难题发起作战。
眼下,我们要对抗的是网线里面的信道环境问题。国内团队研究完信道环境,并做了仿真,遇到困难后,告诉专家团队具体遇到了什么问题;专家团队再针对信道的特征做算法设计。我们这支跨团队的合作模式就像炮兵部队和尖刀连,专家团队凭借着丰富的芯片设计经验,负责提供创新思路,为项目提供火力覆盖;国内的小伙伴熟悉传统算法,贴近工程实现,在落地方面更有优势,在关键时刻去攻克阵地,必要时呼叫炮兵定点轰炸。
跨国合作,见证一个“神奇的算法”
“信道”通俗理解就是网线,要想解决网线中信道环境的问题,就要通过信道测试来摸清信道的特征。然而,信道环境复杂、场景众多,遍历全世界所有的部署场景几乎不可能。为此,专家Edo Poleg和穆童一起,定义了信道环境的典型场景,包括了长线、短线,各种线内连接器的部署方式等,并对它们进行了建模。
尽管如此,还是需要大量的网线实测。我们依旧需要测试几十种用例,还要涉及不同厂家、不同温度、不同的连接器,每次测试还需要涉及28×28组S参数,即使使用自动化测试脚本,工作量依旧极大。为此,我们还呼叫了数通硬件团队的支援,在牛海强、穆童、硬件团队的林立富和马蕴骞的共同协作下,大家购买、制作、捆扎了几百根不同长度的网线进行测试,并在这个过程中获得了极宝贵的实验数据。
牛海强在做信道测试
当信道数据确定后,我们朝着设计出低功耗的算法发起进攻。为了尽快设计出可行的算法,国内团队需要安排一名同事前往海外与专家们当面交流我们在实际落地过程中遇到的问题,并请他们提供解决方案。
“我去吧!”当我还是考虑此行最合适的人选时,邹聪仕自告奋勇地向我提议,“放心吧,我可是经验丰富的‘留子’。”
邹聪仕和他写得密密麻麻的工作草稿
我们面临的最关键的问题就是降低功耗。最初,在与海外专家团队建立连接时,我们只有一个解决问题的大概方向,对具体细节没有思考得太清晰。数字信号处理就是在芯片中做加减乘除的运算,如果运算的次数变少,那功耗就低了。专家团队基于过往的经验和当前的问题提出了一个算法的雏形,表示通过这个算法能让运算次数变少,我们担心这个算法只能保证某些场景下的功耗降低,但会在其他的场景中提升,决定先实操一遍。
接下来的时间,邹聪仕带着具体问题具体分析、具体办法具体解决的态度进行实操,发现这个算法的运算量确实小了不少,而且功耗较低,是非常靠谱的。紧接着,我们快速进入了开发阶段,基于这个雏形,1个多月后,“串绕抵消”算法诞生了。
接手这个项目时,我已经清晰了解了项目全貌,也针对这个项目端到端地搭建过仿真环境,对于问题的捕捉更加敏锐。算法确定后,我便带领着国内团队对算法的复杂度和性能进行分析。
我们和专家团队的配合日益默契。我们发现老算法功耗大的原因主要是线缆上存在多次反射现象,导致滤波器阶数大。海外专家团队很快提出了针对大阶数滤波器的低复杂度方案,并不断实现迭代。后来,当算法进入落地和验证阶段,我们还与数通硬件团队和海思等兄弟部门联动,协同完成任务。
在大家的密切配合下,我们这个从0到1构建的数通园区以太网技术团队,在跨国合作下证明并设计出了这个新的可行算法,突破了10G电口PHY高复杂度、线间串扰等难题,将成果落地芯片,相较老算法降低了全芯片功耗的30%。
吴悦峰、穆童在讨论问题
未来可期,从预研到产品化
作为预研团队,我们的任务主要是进行关键技术突破,并将技术交付给产品化团队。站在这个角度上,我们验证好技术可行性就获得了阶段性的胜利成果。但为了项目能更好地转化,保障芯片的最终成功,同时提升团队成员的工程化能力,我们向海思派遣了包括我自己在内的4名访问学者。
其间,我们与兄弟团队们共同建设了芯片算法平台,不仅最大程度上消除了芯片工程化上的算法风险,也让预研团队熟悉了芯片开发的流程,提升了组织能力。我们在开发的过程中通过做仿真试验,确保性能指标达到目标,以及功耗下降到我们预期的范围。所有指标评估完之后,我们再逐渐交付给海思团队。
从2021年我们接到这个任务开始,到2023年算法进入落地开发,总共用了三年时间。在项目接近尾声之前,我和李莹去了一趟海外,和专家团队一起讨论如何更好地将这个任务落地和收尾。比起聪仕第一次出差的紧张和忐忑,此刻的我们更显松弛,国产化之后,成为国内第一款10G 电口PHY芯片,解决了“卡脖子”的难题,同时提升了芯片竞争力,我们期待着能在2026年产品化。
我们和海外专家团队的合影
虽然我们团队成员不乏名校硕士、博士,但我们两手粘泥、战斗在前线,最终迎来了东风。这个东风不是等来的,而是通过不断的技术积累、反复的测试、仿真后得来的。海外专家团队作为低功耗算法的主要提出方,在项目中做出了巨大的贡献,也因此获得了欧洲研究院的“珠峰挑战奖”“金牌团队”“金牌个人”等荣誉,我们的国内团队也获得了产品线、南京研究所的嘉奖。
“珠峰挑战奖”颁奖现场
“技术突破奖”团队
写在最后
随着数据中心的高速发展,带宽演进的需求更加强烈。产品线在面向AI的网络布局新的业务,2024年,交付完这个项目后,我选择奔赴新战场,从南京研究所这个奋斗了6年的地方再次出发。这次,我的战场转向了德国。
从南京飞往慕尼黑的航班上,我望着舷窗外的云海,一如回国时那般磅礴和辽阔。不知道接下来会面临什么样的挑战,但我的内心变得沉稳和坚毅。这一次奔赴,我也将持续朝着“成就历史性跨越”的小目标而努力!