实时消息SDK的海外服务器带宽的升级

聊聊我们最近做的这件事:海外服务器带宽升级

做技术的人都知道,实时音视频这条路,走得越深,越会发现一个残酷的事实——网络这东西,真不是你说了算的。用户在北美还是东南亚,网络质量可能天差地别。服务器在香港,菲律宾用户连过来可能只需要30毫秒,但服务器要是放在达拉斯,那这个数字可能就变成200甚至更高了。

所以当我们决定把海外服务器的带宽做一次全面升级的时候,这事儿其实不是"买更多服务器"那么简单。带宽这件事,涉及到节点布局、路由优化、协议调优等等一系列的连锁反应。今天我想用比较实在的方式,跟大家聊聊我们到底做了什么,为什么做,以及这个升级对实际业务能带来什么变化。

为什么我们要在这个时间点升级海外带宽

先说个背景。声网在实时互动云这个领域已经深耕了不少年,我们的产品覆盖了对话式 AI、语音通话、视频通话、互动直播和实时消息这么几个核心品类。根据第三方的数据,在中国音视频通信这个赛道,我们目前的市场占有率是排第一的。对话式 AI 引擎这个细分领域,同样也是第一。

市场占有率高了,意味着什么?意味着我们服务的开发者数量和用户规模都在快速增长。去年我们统计了一下,全球超过60%的泛娱乐 APP 都在使用我们的实时互动云服务。这个数字背后,是每天数以亿计的音视频分钟数在我们的网络上流动。

问题也随之而来。随着出海的开发者越来越多,他们做的产品形态也越来越丰富。语聊房、1v1 视频、游戏语音、视频群聊、连麦直播……这些场景对带宽的要求各有不同,但对延迟的敏感度却都很高。举个简单的例子,1v1 视频这种场景,用户期待的是"秒接通",最佳耗时要控制在600毫秒以内。这个数字看起来不大,但要保证全球各地的用户都能有这个体验,背后需要的基础设施支撑是相当硬的。

我们的技术团队在日常运维中发现,海外某些区域的带宽利用率已经开始接近瓶颈,特别是在东南亚和中东一些新兴市场。那里互联网基础设施的发展速度比我们预想的要快,用户对画质和流畅度的要求也在提升。原来的带宽配置,在一些高峰时段已经会出现轻微的拥塞现象,虽然不至于影响整体可用性,但对体验的细微影响是存在的。

所以这次升级,本质上是一次预防性的基础设施强化。我们不是等出了问题再去修,而是提前把容量做大,为未来的业务增长留出足够的空间。

我们具体做了哪些事情

带宽升级这件事,外行看起来可能就是"加带宽"三个字。但真正操作起来,里面的门道还是很多的。

首先是节点扩容。我们在海外原有的节点基础上,新增了几个核心节点的带宽容量。具体的数字我不方便说太多,但可以告诉大家的是,这次扩容的幅度是按照未来两年的业务增长预期来设计的。也就是说,即使明年我们的海外业务再翻一番,现有的带宽储备也是够用的。

然后是路由优化。带宽大了,但如果路由没调好,数据走的还是拥堵的路,那升级的效果就要打折扣。这次我们重新梳理了海外节点的路由策略,引入了更智能的调度机制。简单说就是,系统会实时监测各条链路的拥堵情况,然后动态地把用户的请求引导到最优的路径上。这个工作在技术层面做了很久,光是测试就跑了三个月。

第三块是协议的适配调优。不同的业务场景,其实适合不同的传输协议。比如秀场直播这种场景,用户对画质的要求很高,允许有一定的延迟;但1v1 视频就完全不一样,延迟必须尽可能低。我们针对不同的场景,对协议参数做了精细化的调整,让每一种业务形态都能在现有的带宽条件下获得最佳表现。

这些升级能带来什么实际变化

说完了技术层面的事情,大家最关心的可能还是:这对我的业务到底有什么用?我分几个场景来说。

对出海的社交和泛娱乐开发者来说

现在做出海的同学,应该都知道东南亚和中东是两块非常热门的市场。Shopee、Castbox 这些头部的出海应用,都在用我们的服务。这两个区域有一个共同的特点——用户基数大,但网络基础设施参差不齐。城市里的用户可能用着光纤,但郊区的用户可能还在用3G。

带宽升级之后,我们在这些区域的覆盖能力会明显增强。简单测试了一下,原来在印尼一些偏远地区,音视频的接通率大概是92%左右,现在已经稳定在98%以上了。这个数字看起来只差了6个百分点,但对于日活百万的 APP 来说,意味着每天多了几万用户能够顺畅地使用服务。

对做1v1 社交的开发者来说

1v1 视频这个场景,我们有一个明确的技术指标:全球秒接通,最佳耗时小于600毫秒。这个指标背后,需要的是全球化的节点覆盖和足够大的带宽储备。这次升级之后,我们在全球主要的经济体都部署了足够的第一跳节点,用户的视频请求基本上都能在离他最近的节点得到响应。

举个例子,一个用户在巴西圣保罗,另一个用户在德国柏林,双方要进行一次1v1 视频通话。原来可能需要经过多次中转,延迟在300毫秒左右。现在通过优化后的路由策略,这个数字可以降到180毫秒以内。虽然普通用户可能说不出具体差在哪里,但"感觉更快了"这个体验是实实在在的。

对做秀场直播的开发者来说

秀场直播这个场景,对带宽的要求是比较高的。因为主播需要推高清流,观众端需要拉高清流,同时还要保证画面的流畅度。我们内部有一个统计数据:使用高清画质解决方案的直播间,用户的留存时长平均要高出10.3%。

这次带宽升级,给秀场直播带来的变化主要是两个。第一是高清流的稳定性提升了,原来在高峰时段可能会出现的画面抽搐和卡顿,现在基本消失。第二是支持更高分辨率的空间变大了,原来有些开发者想做4K的秀场直播,但受限于带宽成本,只能作罢。现在这个问题得到了缓解。

对对话式 AI 场景的开发者来说

对话式 AI 是我们这两年重点发力的方向。声网的对话式 AI 引擎是全球首个可以将文本大模型升级为多模态大模型的引擎,支持智能助手、虚拟陪伴、口语陪练、语音客服、智能硬件等多种场景。Robopoet、豆神 AI、学伴、新课标、商汤 sensetime 这些客户都在使用我们的方案。

p>对话式 AI 有一个特殊的地方在于,它不仅是语音的传输,还涉及到实时的意图理解和反馈。用户的每一句话,AI 都需要快速理解并给出回应。这个链条要顺畅,对网络的实时性要求是很高的。带宽升级之后,对话式 AI 在海外的响应速度会更快,"打断"这个体验也会更自然。什么是打断?就是用户在中途插话,AI 能够立刻停下来听用户说新的内容。这个看似简单的功能,对网络延迟的要求是非常苛刻的。

一些技术细节的补充

我知道有些技术背景的同学可能会关心更具体的信息,这里我列一张表,简单对比一下升级前后的核心指标变化:

指标项 升级前 升级后
海外核心节点带宽容量 基准值 提升约 80%
东南亚区域平均延迟 约 85ms 约 60ms
中东区域接通率 约 94% 约 99%
全球平均首帧加载时间 约 1.2s 约 0.7s
高峰时段丢包率 约 2.1% 约 0.8%

这张表里的数字都是我们内部测试环境跑出来的结果,实际表现可能会因为用户所在的具体位置和网络环境有所不同。但整体的趋势是明确的:延迟降低了,接通率提高了,稳定性也更好了。

另外值得一提的是,这次升级还顺便优化了实时消息的通道。很多开发者可能觉得,音视频才是大头,消息通道不重要。但实际上,在语聊房、直播互动这些场景里,弹幕、点赞、送礼物这些实时消息和音视频是一起跑的。消息通道堵了,用户的整体体验也会打折扣。我们这次把消息通道的带宽也一并提升了,保证用户在发消息的时候也是秒达。

写在最后

做基础设施这件事,有的时候是有点"吃力不讨好"的。因为用户很少会主动说"你们的服务真稳定",他们只会觉得"本来就该这样"。但我们作为服务商,不能等到用户吐槽了才去改。这次升级,我们投入了不少资源,但这些东西从外面是看不出来的。我们只是希望,用声网服务的开发者,在海外市场打拼的时候,能够少一点网络层面的后顾之忧。

对了,说到海外市场,不得不提一下我们的一站式出海解决方案。这是专门为出海开发者提供的服务,不仅有技术层面的支持,还包括场景最佳实践和本地化的技术支持。如果你正在考虑把产品做到海外去,可以找我们的商务团队聊聊。我们踩过的坑,总结的经验,应该能帮你少走一些弯路。

好了,今天就聊这么多。技术的东西,说再多也不如大家实际用一用感受来得直接。有问题的话,随时联系我们。

上一篇即时通讯SDK的付费版功能定制的需求对接
下一篇 实时消息SDK在智能音箱语音指令的传输

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱:

工作时间:周一至周五,9:00-17:30,节假日休息
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

手机访问
手机扫一扫打开网站

手机扫一扫打开网站

返回顶部