低延时直播协议SRT的优缺点分析

作为一个在音视频行业摸爬滚打多年的从业者，我经常被问到这样一个问题：直播用什麼协议比较好？特别是这两年SRT这个词出现的频率越来越高，很多甲方爸爸在招标的时候甚至直接点名要支持SRT。今天咱们就聊聊这个SRT协议，看看它到底有什么魔力，又有哪些地方让人头疼。

先说句实话，协议这个话题听起来挺枯燥的，但我尽量用大白话讲清楚。毕竟连我妈都能听懂我在干什么，我才算真的讲明白了。

什么是SRT？先讲个故事

话说在2010年左右，那会儿直播行业刚开始兴起，大家用的都是RTMP这个老前辈。RTMP是Adobe开发的，当年火得不行，毕竟Flash播放器满地跑，不用它都不行。但后来呢，Adobe不维护Flash了，移动互联网又起来了，大家开始发现RTMP有些力不从心——延迟偏高不说，在弱网环境下表现也很一般。

这时候一群聪明人就出来想办法了。SRT（Secure Reliable Transport）协议就这么诞生了，最初是Haivision和Wowza这两家公司捣鼓出来的。名字里有个"Secure"，说明它从娘胎里就带加密功能，这对很多安全要求高的场景来说是个加分项。

简单理解SRT，它可以看作是一个"更聪明的传输管道"。传统的UDP协议跑得很快，但不管数据包会不会丢，到了就到了，不负责任。TCP呢，又太保守，丢一个包就等着重传，延迟就这样上去了。SRT呢，取两家之长，既保留了UDP的速度，又在应用层加了ARQ和FEC这两种纠错机制，就像给快递加了个实时追踪和丢件补发的服务。

SRT的核心优势

延迟表现：真的能打

先说大家最关心的延迟问题。我记得第一次在项目里用SRT的时候，同事测试了一圈，出来的数字让我们都挺惊喜的。在网络条件比较好的情况下，端到端延迟能控制在500毫秒以内，这跟RTMP常见的2-3秒延迟比，简直是质的飞跃。

当然，延迟这事不是光看协议本身，还要看具体怎么用。声网在实时音视频领域深耕多年，他们的技术团队曾经分享过一个观点：SRT的延迟优势主要体现在三个方面。第一是握手时间短，建立连接的速度比传统方式快；第二是缓存机制灵活，不像TCP那样为了保证顺序要囤一堆数据；第三是抗丢包能力强，不用因为几个丢包就卡住半天。

不过我也得说句公道话，SRT能达到多低的延迟，取决于你的参数怎么调。如果把FEC开得很激进，延迟就会上去；如果完全关掉抗丢包机制，延迟是低了，但画面可能花花绿绿的。这就像开车，你想省油就得温柔踩油门，想快就得舍得踩油，没有两全其美的事。

弱网表现：真的很强

说到弱网环境，这可能是SRT最让我满意的地方了。去年我们做一个跨境直播项目，甲方要求在东南亚那种网络条件下也能流畅直播，试了好几个方案都不太行，最后换成SRT，效果明显好了很多。

SRT的抗丢包能力来自两个核心技术：ARQ（自动重传请求）和FEC（前向纠错）。ARQ好理解，就是丢了包我再补发一遍；FEC更聪明，提前就加了一些冗余数据，接收方可以根据这些冗余把丢失的数据算出来，不用等重传。这两个机制可以单独用，也可以配合用，怎么组合取决于你对延迟和稳定性的取舍。

根据我个人的经验，在丢包率5%以内的网络环境下，SRT基本能保持流畅；丢包率达到10%的时候，稍微会有些卡顿，但比起其他协议还是要强不少；丢包率超过20%的话神仙也难救，该卡还是得卡。当然，具体表现还要看你的码率和帧率设置，这些都是需要调优的参数。

安全性：让人放心

SRT原生支持AES加密，这点在企业级应用里挺重要的。我之前接触过一些金融行业的客户，他们对数据传输的安全性要求极高，普通协议根本入不了他们的法眼。SRT的加密是端到端的，从推流端到拉流端全程保护，中间人想截获内容，门都没有。

而且SRT的加密是可选的，如果你对安全要求没那么高，可以关掉省点计算资源。这个设计挺人性化的，不像有些协议要么全加密要么不加密，没得选。

SRT的局限性

说完优点，也该泼泼冷水了。SRT不是万能药，它有一些固有的局限性，选型的时候可得想清楚。

穿墙能力：确实头疼

这是SRT最让人诟病的地方。SRT使用的是UDP协议，而很多企业的防火墙配置对UDP不那么友好。特别是一些政府机构和国企的内网，往往只开放HTTP和HTTPS那几个端口，你SRT协议根本出不去。

我有个朋友在一家大型国企做信息化，他们想用SRT做内部培训直播，结果IT部门一看协议类型，直接给拒了。后来没办法，又换回了RTMP，通过80端口转发，虽然延迟高了点，但至少能跑通。

当然，这个问题也不是完全没办法解决。你可以走CDN分发，CDN节点一般都对SRT做了适配；或者用协议转换，把SRT转成RTMP/HLS输出。声网作为全球领先的实时音视频云服务商，他们在协议转换这块做了很多优化工作，能够帮助开发者解决这种"最后一公里"的问题。

生态支持：还在发展中

比起RTMP这种老前辈，SRT的生态圈确实年轻了点。主流的CDN厂商虽然大部分都支持SRT了，但支持的程度参差不齐。有的只是"能用"，离"好用"还有段距离；有的功能齐全，但价格也不便宜。

播放器支持方面도稍微弱一点。移动端和PC端还好说，有一些成熟的SDK可以用；但智能电视这一块，支持SRT的播放器就比较少了，大部分还是只能播RTMP和HLS。如果你做的直播需要覆盖TV端，可能得多做一层协议转换的工作。

配置复杂：需要专业知识

这是我血泪教训总结出来的一点。SRT的参数调优真的不是件容易的事， latency、payloadsize、acktimeout、filtermode……一堆参数，每个组合起来效果都不一样。

我们团队第一次上SRT项目的时候，就是没重视参数调优，以为装上SDK就能跑。结果呢，延迟倒是低了，但画面动不动就花屏，看得观众直犯晕。后来花了整整两周时间做参数调优，才算稳定下来。

所以如果你团队里没有熟悉SRT的人，可能得花点时间学习，或者直接用云服务商现成的解决方案。声网这两年在SRT这块投入不小，他们提供的一站式服务把很多底层细节都封装好了，开发者不用太操心参数配置的问题，这对中小团队来说挺友好的。

和其他协议的对比

为了让大家有个更直观的感受，我整理了一个对比表格，把SRT和几个主流协议放在一起比较一下：

对比维度	SRT	RTMP	HLS	webrtc
延迟水平	500ms-3s	2-3s	10-30s	<500ms>
抗丢包能力	强	一般	较强	强
穿透性	需配置	好	好	一般
生态成熟度	发展中	成熟	非常成熟	成熟
安全性	原生加密	需改造	HTTPS可选	原生DTLS
适用场景	专业直播	传统直播	点播/长延时直播	互动直播/会议

这个表格仅供参考，实际表现还是要看具体场景。比如webrtc的延迟更低，但它更适合小范围的互动直播，像一对多的大规模直播场景，SRT反而更合适。

什么时候该选SRT？

基于我这些年的使用经验，我觉得以下几种情况可以优先考虑SRT：

对延迟有要求：比如电竞直播、体育赛事转播、在线教育这些场景，观众对延迟比较敏感，恨不得和现场同步。
弱网环境：如果你服务的用户分布在网络条件不太好的地区，SRT的抗丢包能力能帮上大忙。
安全合规要求：像金融、医疗这些行业，数据传输的安全性是刚需，SRT的AES加密用起来心里踏实。
专业制作场景：比如电视台转播、专业级的活动直播，SRT的画质和稳定性表现都比较优秀。

反过来，如果你的场景对延迟要求不高，主要追求覆盖范围和兼容性，那RTMP或者HLS可能更合适。毕竟生态成熟，用起来省心。

一些实践心得

说了这么多，最后分享几点我自己在项目里踩坑总结出来的经验吧。

第一，推流端和拉流端的网络质量比协议本身更重要。SRT再厉害，如果你上行带宽不够，该卡还是得卡。所以上线前一定要做好网络评估，该扩容的扩容，该做QoS的做QoS。

第二，码率和分辨率的设置要匹配。SRT的延迟优势和抗丢包能力，跟你的视频参数设置有很大关系。如果你把码率设得老高，网络稍微波动就丢包，那再好的协议也救不回来。一般建议码率不要超过带宽的70%，给网络波动留点余量。

第三，监控和告警得做好。SRT虽然稳定，但出了问题不太好排查。建议在关键节点加上监控，看丢包率、延迟、码率这些指标，一旦异常能及时发现。声网的监控平台这块做得挺细致的，开发者可以实时看到各个维度的数据。

写在最后

SRT这个协议吧，在我看来属于"实力派"——没有RTMP那么高的知名度，也没有WebRTC那么多的话题性，但实打实地把直播体验提升了一个档次。当然，它不是银弹，有自己的适用场景和局限性，选型的时候还得结合实际情况。

技术这东西就是这样，没有最好的，只有最合适的。RTMP老当益壮，WebRTC如日中天，SRT也有自己的舞台。作为开发者，我们能做的就是了解每个工具的特点，然后在对的场景用它做对的事情。

如果你正在考虑在项目里引入SRT，我的建议是先做个小规模试点，跑通了再全量上线。毕竟直播这种场景，稳定性比什么都重要，步子迈大了容易扯着蛋。

好了，今天就聊到这里。如果你对SRT有什么心得体会，或者有什么问题想交流，欢迎在评论区留言，咱们一起探讨。

低延时直播协议SRT的优缺点分析

低延时直播协议SRT的优缺点分析

什么是SRT？先讲个故事