一位博士在华为的22年(6)

2023-10-27 来源:旧番剧
不得已,我们启动代码检视工作,从正向查。虽然软件也发现了一些代码的Bug,但仍未找到问题的原因。我们继续查芯片和逻辑代码。虽然代码检视是非常痛苦的决定,但终于在检视时发现对报文length byte字段定义为0的报文缺乏处理,一旦该字段为0,报文就处理死锁了。发现了这个隐患,但到底是不是由它引起,还不能百分百确定。于是又请硬测兄弟专门构造这样的报文在测试环境中尝试,果然不出所料,网上的场景终于复现。因为问题重大,我们仍不敢把话说满,期望客户给我们一个机会进行验证。经过验证,确实由此引起,问题得以顺利解决。
这也让我明白,流程不是万能的,最终解决问题的还是人的智慧。流程只能帮助我们不犯以前犯过的错误,但不能保证我们不犯错,所以流程只应该是保障业务成功的工具之一,而不应本末倒置,用流程来包打一切,乃至掩盖问题。
05
可能是因为在解决问题上的突出成绩,领导提拔我做部门的管理者。起初觉得是一种责任担当,义不容辞,几年下来才知自己可能是冲锋陷阵的战士,而不是一个适合的管理者。只可惜领悟得有点晚,在这里也跟硬件部的XDJM(兄弟姐妹)们道个歉。
接手的时候,NE80/NE40逐步稳定下来,但新推出的产品又问题频出。那个时候,我们为每一个芯片的稳定疲于奔命,甚至是帮着厂商进行稳定。放在平台规划、能力提升方面的精力自然少了,大家都是直接拉到战场上边战斗边学习。有些兄弟姐妹长期处于这样的环境下,可能觉得看不到希望,就离开了。现在回想起来,在那样艰难的情况下,第一代数通领导陈俊华、柏璐、邓抄军等是可敬的,他们做出了VRP平台化等超前决策与布局,还有接入网过来的李剑亲自操刀NP的自研。从后来的发展情况看,也正是有了这些,数通才得以走向自由之路。
数通的发展经历了很多磨难。不管是核心芯片的获取,业务的剥离,还是与思科的官司,在艰难中总有一批数通人不计得失地默默奉献着,用内心之火照亮着大家,日复一日、月复一月地努力向前。还记得陈总去香港见供应商A公司的高层,要求解决过孔失效问题,但对方却始终充满了傲慢。无线同样出现了这个问题,求助数通一起攻关。靠供应商靠不住,我们就在系统上想办法,与负责微码的李晓武一起组织兄弟们开创性地设计了Atom微内核的故障在线隔离与恢复,以确保故障时不影响业务。
后来公司从前期摇摆的战略到明确数通要坚持投入,丁耘来到网络。公司急盼数通能走出困境,便从核心网调来了有成功经验的干部查钧、胡克文。经过多年的摸爬滚打,我们提出了E2E维护的系统五步法,从来料、设计、开发验证、出厂测试、网上梳理出质量保证手段;第一次明确了“硬件不可能100%不坏,坏了不能影响业务,主动运维”等。
猜你喜欢
动漫推荐
免责声明:动漫番剧数据来源网络!本站不收费,无vip,请勿上当!

www.jiufanju.com-旧番剧