文档介绍：连麦解决方案资料 1. 视频直播连麦服务提供商: 目前市场上做的比较好被多家直播平台打包接入的有声网( agora ), 即构科技, 还有一些小一点公司如国士无双。 2. 视频直播连麦定义: 简单来说就是当主播直播期间, 可以与其中某一个观众或者几个粉丝进行互动, 并且其他观众能够观看到这个互动过程。 3. 视频直播连麦互动流程图: a )主播正常开始直播,普通观众看到主播的单人直播画面; b )需要连麦的观众发起连麦请求,进入连麦申请列表; c )主播从连麦申请列表中选择一名或多名观众进行连麦操作,主播与连麦观众进行实时音视频互动,同时互动直播系统生成“合成画面”; d )普通观众看到直播画面为包含主播与连麦观众的“合成画面”; e )连麦结束,恢复主播单人直播模式。 4. 常见的连麦技术方案: 连麦方案之一: 两路 RTMP 1. 主播首先发布视频到流媒体服务器, 用户从流媒体服务器拉取视频信息; 2. 其中某个用户希望与主播连麦, 他通过信令服务器向主播请求连麦, 主播同意连麦请求; 3. 连麦者发布视频到流媒体服务器; 4. 主播端和其他用户获取连麦者发布的视频, 在手机端采用画中画形式显示。优势: 1. 完全基于现有 RTMP 技术,开发简单,容易实现。劣势: 1. 主播和参与连麦的粉丝之间的交互延迟太大,基本无法正常交流。 2. 声音效果不好, 主播和连麦粉丝之间会产生回波。 3. 客户端接收两路视频, 流量消耗高, CPU 消耗高。 4. 主播和连麦的时序没有保证,普通粉丝的体验感很差。结论: 基本不能使用,用户体验感极差,实际效果差。连麦方案之二: P2P+RTMP 1. 主播首先发布视频到流媒体服务器, 用户从流媒体服务器拉取视频信息; 2. 连麦者请求连麦, 此时主播端会弹出连麦请求, 主播选择连麦用户, 连麦者和主播建立 P2P 连接; 3. 主播端和连麦者之间建立了 P2P 通道, 通过此通道进行音视频数据的交互; 4. 主播端本地进行混频和混音,再发送给流媒体服务器; 优势: 1. 主播和连麦者之间的交互延迟小,交互非常顺畅; 2. 可以采用回声消除,声音效果较好。 3. 主播和连麦用了混音和混频,可以同步,对于普通用户的体验较好。劣势: 1. 主播端有两路视频上传,一路下载,网络要求高。加大了连麦端的延时。 2. 主播端要进行混频和混音,性能消耗高。 3. 主播和连麦在复杂的网络情况下, P2P 有可能不能成功。 4. 不能支持多路混频,扩展性不好。结论: 能达到一定的效果,但是有比较大的改进余地。连麦方案之三: 视频会议+RTMP 1. 主播端加入视频会议系统; 2. 视频会议系统把主播的视频流推向 CDN, 观众通过 CDN 观看主播视频; 3. 参与连麦的观众登录到与主播端同一个视频会议频道中, 此时主播端和连麦者通过实时的视频会议进行交互; 主播与连麦者的视频, 经过服务端混合后输出给 CDN; 4. 其他用户通过 CDN 观看主播与连麦者的交互; 优势: 1. 通过视频会议系统,主播和连麦者之间的交互延迟小,交互非常顺畅; 2. 采用回声消除,声音效果较好,采用混频,同步效果好,对于普通用户的体验较好。 3. 对于主播端的性能要求不高,对于网络的适应性更好。 4. 支持多人交互,可扩充性好。劣势: 1. 服务端相比于一般的直播系统, 还多增加了视频会议系统, 开发复杂性高; 2. 音视频混合在服务端完成, 对服务器性能要求高; 结论: 能达到最好的效果,对于服务要求比较高的厂商的推荐方案 5. 声网连麦介绍: 全球首个基于 UDP 的直播 SDK , 只有毫秒级的延迟, 10000 人语音连麦,7 人视频连麦。官网: 连麦的基本架构图: 声网连麦的主要特性: 声网连麦技术方案解析: 声网 , 在开发互动直播解决方案时, 抛弃传统的基于 TCP 协议的 CDN 方案, 从底层协议和布网上开始,创建了基于 UDP 协议的 SD-RTN 方案。(一)什么是 SD-RTN SD-RTN ( Software-Defined Real work ),软件定义实时传输网络,是一种新型的专为内容实时传输而设计的网络架构。通过在互联网上不同地区的数据中心放置软件组网单元, 相互连接互相调度, 在现有的公共互联网基础上构建一层新的虚拟网络。 SD-RT N 系统能够实时根据各节点的连接和传输状况、负载状况以及到用户的距离和响应时间, 自动分配最优、最通畅的传输路径,达到实时传输需要的质量保障级别。(二) SD-RTN 与 CDN 有何不同基本原理不同。 CDN 是存储转发结构,设计目的是在各个边缘节点缓存待分发内容,结构上从源站到观众是伞状多级缓存放大方式。 SD-RTN 本质上一个实