T-Mobile解释了其网络为何瘫痪的原因 声称只有五分之一的电话丢失


如果您一直想知道什么会破坏三大蜂窝运营商之一的传递电话和短信的能力,并在一整天中保持这种状态,那么T-Mobile现在有部分答案是涉及星期一全国范围内的停电 。
该公司在星期二晚些时候道歉,您可以在下面全文阅读 。在星期四,CTO Neville Ray提供了进一步的解释,您可以在本文的底部找到 。
简短的版本,如果我们正确地理解了这一点:光纤电路出现故障,备用电路也出现故障,这会导致连锁反应,使网络紧张,以至于许多呼叫和短信都无法通过 。
较长的版本:
太平洋标准时间2020年6月16日下午6:23
T-Mobile语音和文本性能更新
每天,我们都看到技术在保持我们联系方面的重要作用,并且我们知道T-Mobile客户依靠我们的网络来确保他们与家人,亲人和服务提供商保持联系 。这是我们团队非常重视的责任,也是我们的最高优先事项 。昨天,我们没有达到自己的卓越标准 。
昨天,我们的许多客户都遇到了语音和文本问题,尤其是VoLTE(LTE语音)呼叫 。我的团队立即采取了行动-我们数百名工程师全天不懈地与供应商和合作伙伴一起努力,从我们意识到的那一刻开始解决问题 。数据连接继续有效,我们的非VoLTE吸引了许多客户,FaceTime,iMessage,Google Meet,Google Duo,Zoom,Skype等服务也使我们的客户保持联系 。此外,许多客户能够使用电路交换语音连接,并且Sprint网络上的客户不受影响 。昨晚PDT晚上10点,所有地区的VoLTE和文本已完全恢复 。我很高兴地说该网络已完全正常运行……并且我们日复一日地努力保持这种状态 。
我们的工程师通宵工作,以了解昨天问题的根本原因,加以解决并防止其再次发生 。已知触发事件是东南部第三方提供商提供的租赁光纤电路故障 。这是每个移动网络上都会发生的事情,因此我们与供应商合作建立冗余和弹性,以确保这些类型的电路故障不会影响客户 。这种冗余使我们失败了,并导致了过载情况,然后再加上其他因素 。这种过载导致IP流量风暴从东南部蔓延,从而在支持VoLTE呼叫的IMS(IP多媒体子系统)核心网络上造成了严重的容量问题 。
我们已经与IMS(IP多媒体子系统)和IP供应商合作,添加了永久性的附加保护措施,以防止再次发生这种情况,并且我们将继续努力确定最初的过载故障的原因 。
因此,对于昨天给我们带来的任何不便,我要亲自道歉,并感谢您在我们努力解决问题时的耐心配合 。
内维尔·雷
T-Mobile技术总裁
目前尚不清楚哪个第三方提供商的光纤电路发生故障 。周一有报道称,全球主要的互联网骨干网提供商之一的Level 3正在发生中断,但一位发言人告诉TechCrunch的情况有所不同 。
【T-Mobile解释了其网络为何瘫痪的原因 声称只有五分之一的电话丢失】周四,雷在富国虚拟5G论坛上的一次演讲中淡化了断电情况,声称仅T-Mobile的20%的呼叫被掉线,因为客户可以使用移动数据来完成其他呼叫 。
他说:“整个事情是由常见的花园光纤中断引发的,”它“在路由问题配置中暴露了一个问题,导致整个网络中的这些IP洪水之一,”进而“造成了各种各样的后果 。核心架构中的容量和保护措施” 。
“在解决问题真正存在的地方之后,我们要做的就是快速增加很多容量,” Ray说 。
雷说:“我们必须做得更好 。”他没有提供任何有关T-Mobile将来如何防止此类问题的建议 。他将中断描述为一个偶然事件:“这是一系列事件,从许多方面来看,从光纤中断,路由网络到核心漏洞,所有这些事情都是同时发生的,这就是我们看到的中断 。”
“永远不要说永远,停机始终是一家技术公司的一部分,但我们深表歉意,而且我们处在一个更好的位置 。”

    推荐阅读