基于VOLTE 网络的视频彩铃解决方案

(整期优先)网络出版时间:2022-07-10
/ 3

基于VOLTE 网络的视频彩铃解决方案

吴涛

中国电信股份有限公司湖北增值业务中心,湖北省武汉市 430000

摘要:VOLTE视频彩铃业务是一项由被叫用户定制,为主叫用户提供一段悦耳、多彩有趣的视频媒体来代替普通网络回铃音的增值类业务。在增值类业务发展的过程中,彩铃业务凭借其个性化服务和成熟的技术,一直占据很高的市场渗透率。VOLTE语音解决方案的发展为视频彩铃业务提供了新的契机,相关技术为媒体服务器的设计奠定基础,本文的目标是通过对VOLTE视频彩铃系统的信令控制模块和媒体服务器模块进行分析,设计媒体服务器的业务流程和技术方案,以实现彩铃的媒体放音,同时降低由于图像传输错误而引发的错误扩展的影响,提高用户体验感。

关键词:VOLTE网络;视频彩铃;信令控制;媒体放音

一.视频彩铃概述

视频彩铃是指用户在VOLTE网络下拨打语音电话或视频电话,呼叫接通前看到一段视频内容,与传统的音频彩铃相比,呼叫者不仅能听到回铃音,还能看到一段被呼叫者设定的视频内容,带来视觉和听觉的双重享受[1]。VOLTE 用户申请开通视频彩铃功能后可自行设定个性化的视频彩铃,在被叫时的振铃阶段,系统为主叫用户播放其个性化设置的视频彩铃媒体。当被叫用户处于忙、不在服务区、关机等非空闲状态情况下时,仍播放原网络系统提供的通知。视频彩铃是在传统彩铃音频形式上升级短视频,在通话振铃期间向用户呈现的音视频融合媒体服务。视频彩铃用户可以自己制作或上传个性化视频内容,也可以从运营商的视频库中进行选择,还可以针对不同主叫方、不同时间段设定不同的视频内容。

二.视频彩铃的网络结构

在 VOLTE 网络架构中,呼叫流程需要主叫侧和被叫侧网元配合完成,其中主被叫侧均涉及 PCSC、SCSCF、AS 等网元。为了实现视频彩铃业务,在 VOLTE 网络架构中增加了视频彩铃业务 AS 作为视频彩铃管控网元,协助完成视频彩铃用户在呼叫流程中的资源预留和媒体协商等信令交互过程。用户订购了视频彩铃后,HSS 中会增加对应视频彩铃的特性,当用户做被叫的时候,被叫侧的 SCSCF 会根据特性配置将呼叫触发到视频彩铃 AS,由视频彩铃 AS 完成为主叫用户播放视频的信令消息交互。

视频彩铃平台采用集约化部署的方式为移网和固网用户提供彩铃服务,平台包含业务管理和放音两部分。业务平台采用1点部署支撑全国的互联网集约化模式,放音平台由业务平台统一调度管理。

  1. 平台与IMS核心网互联方式

视频彩铃放音平台通过 SIP 信令与 IMS 核心网对接,完成视频彩铃业务触发和放音。视频彩铃呼叫触发方式遵循 3GPP 24.182 Gateway 协议规范,采用主被叫 IMS 域触发原则,VOLTE 用户需签约彩铃 IFC,当主叫域发起的初始

INVITE 消息送至主被叫 IMS 域 S-CSCF 后,S-CSCF 通过用户的 IFC 签约信息将呼叫触发到视频彩铃放音平台,视频彩铃放音平台处理之后将呼叫消息返回到 S-CSCF,继续进行呼叫流程。当视频彩铃放音平台收到被叫振铃消息后,向主被叫用户发起视频彩铃媒体协商和放音;当被叫摘机后,视频彩铃放音平台停止视频彩铃放音并发起 Re-INVITE 流程,完成主被叫之间的媒体重协商并最终完成主被叫用户之间通话话路搭建。

  1. IMS路由机制

IMS域彩铃触发遵循3GPP24.182协议规范,其路由机制主要包括以下5个步骤:

步骤1:主叫IMS域发送INVITE消息至被叫IMS域S-CSCF。

步骤2:被叫IMS域S-CSCF查询用户IFC签约信息,触发IFC评估流程,将INVITE消息送至TAS服务器。

步骤3:TAS服务器启动被叫域选流程,获取被叫所在的域信息,并通知S-CSCF被呼叫。

步骤4:被叫震铃后回消息后,彩铃平台启动向主叫用户的放音流程。

步骤5:当被叫摘机后,彩铃平台发起RE-INVITE流程,邀请被叫重新带入被叫SDP信息,并发UPDATE消息给主叫,带入主叫的SDP信息,并最终完成主、

被叫用户之间通话。

  1. BICC/ISUP路由机制

BICC/ISUP路由主要包括以下6个步骤:

步骤1:主叫MSC或者GMSC发起SRI操作。

步骤2:HLR检查被叫是否具有彩铃信息SS CODE254,同时检查结果以SRI-ACK消息返回。

步骤3:主叫MSC或者GMSC按照普通呼叫过程接续到被叫MSC.

步骤4:主叫MSC或者GMSC返回ACM信令,并且其中状态指示为空闲时,主叫MSC根据彩铃呼叫标识,暂时阻塞被叫MSC的普通回铃音,同时向彩铃平台发起呼叫。

步骤5:彩铃平台根据主被叫的逻辑关系向主叫侧播放彩铃。

步骤6:主叫MSC收到被叫MSC的ANM回答信令时,拆除与彩铃平台的连接,向主叫侧回答信令,重新激活被叫用户之间的通话路由。

三.视频彩铃的实现技术

1.信令控制技术

SIP(Session Initiation Protocol会话初始协议)是一个用于实现信令控制的协议,在协议层次中可以划分到应用层。SIP可以实现一个或者多个会话的创建、修改和释放。SIP协议经常应用在多方会议、VOIP及彩铃业务系统中。不仅如此,SIP是基于文本的独立于底层会话与传输的协议,透明的支持重定向和地址映射服务并且拥有为用户提供建立终端会话的能力。

SIP的会话构成包括四个基本组件:SIP用户代理、SIP注册服务器、SIP代理服务器和SIP重定向服务器,这些组件之间通过传输SDP协议定义的消息来完成通信[2]SIP的网络结构是C/S(Client/Server)模式,包括两种SIP元素,用户代理UA(User Agent)和SIP服务器。用户代理分为代理终端UAC(User Agent Client)和代理服务器UAS(User Agent Server),UAC用于发送请求与接收响应,类似于传统电话和语音通信的发起端,UAS用于处理请求并返回响应结果,类似于传统电话或语音通信的接收端。代理服务器主要是将请求和响应转发给其他代理服务器,注册服务器用于处理的UA注册请求并记录UA的位置信息,定位服务器主要用于提供定位服务,以获取被叫方的位置信息,重定向服务器在逻辑上类似于UA,主要应用于地址重定向,不对事务进行处理。VOLTE视频彩铃系统与其他通信网元之间主要使用SIP协议实现信令控制。

2.媒体传输技术

RTP(Real Time Transport Protocol,实时传输协议)是一种网络传输协议,用来为IP网上的语音、图像、传真等多种需要实时传输的多媒体数据提供端到端的实时传输服务[3]

RTP应用的传输层可以使用UDP(User Datagram Protocol,用户数据报协议),但也使用TCP(Transfer Control Protocol,传输控制协议)。RTP协议通过RTCP协议的配合实现流量控制和拥塞控制。使用RTP协议传输媒体流之前,需要按照RTP包格式来封装媒体数据,并利用与它绑定的协议进行媒体包的传输。RTP端口号在1025到65535之间随机选择一个未使用的偶数UDP口号,而同一次会话中的RTCP则使用下一个奇数UDP端口号。

RTP流媒体应用的典型协议栈如图1所示:

图 1

从图中可以看出,流媒体应用的应用层协议主要有SIP会话初始协议、SDP会话描述协议、RTSP实时流传输协议及HTTP协议等。VOLTE视频彩铃系统中的信令服务器与IMS核心网中的P-CSCF以及MGCF等网元在应用层使用SIP协议,传输层使用TCP协议建立通信,实现信令控制。VOLTE视频彩铃系统中的媒体服务器与对端MGW之间利用利用RTP/UDP/IP协议传输媒体流。

每一个RTP包都由头部(Header)和负载(Payload)两个部分组成,其中头部前12个字节的含义是固定的,而负载则可以是音频或者视频数据。RTP Header的定义如图2所示:

图 2

RTP Header中各个参数的详细介绍如下:

版本号(V):占2个比特,用来标志使用的RTP版本。

填充位(P):占1个比特,如果该位的值为真,则该RTP包的尾部就包含附加的填充字节。

扩展位(X):占1个比特,如果该位的值为真,RTP固定头部后面就跟有一个扩展头部分。

CSRC计数器(CC):占4个比特,含有固定头部后面跟着的CSRC的数目。

标记位(M):占1个比特,用来标识重要事件,例如帧边界。

载荷类型(PT):占7个比特,用来标识RTP载荷的类型。

序列号(SN):占16个比特,发送方随机选择一个初始值,每发送完一个RTP包,下一个RTP的序列号加1。

时间戳(Timestamp):时间戳(Timestamp):占32比特,用来反映RTP包中数据的第一个字节的采样时间。在会话开始时,时间戳Timestamp进行初始化。接收端根据接收到的RTP包中的时间戳实现音视频媒体同步。

同步源标识符(SSRC):占32比特,同步源就是用来标识RTP包流的来源。在同一个会话中,SSRC的值是唯一的。

贡献源列表(CSRC List):0~15项,每项32比特,每个CSRC标识了包含在该RTP报文有效载荷中的所有作用信源。

四.媒体服务器的分析与设计

本文基于网关模式设计媒体服务器的通信架构,彩铃AS与IMS中其他网元之间利用SIP协议通信,而系统内部的各个服务器之间,利用内部消息进行通信,而不是标准的SIP协议。媒体服务器的通信架构图如图3所示。

图 3

从图中可以看出,信令服务器解析查询会话控制I-CSCF或业务会话控制S-CSCF发送的SIP请求,并生成相应的内部消息通过网关发送到业务处理服务器、媒体服务器以及数据库代理服务器。内部消息主要包括:业务处理服务器启动消息及响应消息、铃音文件获取消息及响应消息、媒体服务器启动消息及响应消息、媒体服务器再启动消息及响应消息、铃音播放消息及响应消息、停止播放消息及响应消息。此外还包括业务处理失败时需要发送的消息。

彩铃AS的各个服务器之间利用socket实现内部消息通信,传输层使用面向连接的、可靠的传输控制协议TCP。由于媒体服务器使用RTP协议向对端传输媒体流,因此传输层使用用户数据报协议UDP。也就是说,媒体服务器需同时支持处理TCP包和UDP包。为了实现内部消息处理以及RTP包的传输,同时为了提高程序的执行效率,媒体服务器利用了多线程编程技术。线程间通信方式主要包括全局变量设置、参数传递以及消息传递三种类型。媒体服务器通过消息传递方式来实现线程间的通信。媒体服务器各个线程间的消息通信图如下图4所示。

图 4

从图中可以看出,媒体服务器至少创建8种类型的工作线程来实现媒体播放的功能,主线程与其他工作线程之间通过消息传递的方式来实现通信。

媒体服务器采用异步消息发送机制,即消息发送完成之后,立刻返回,并不等待消息的处理。主线程与工作线程的消息处理主要利用定时器驱动和事件驱动两种来实现。定时器驱动是指为工作线程设置定时器,工作线程在时刻到来时执行一次。事件驱动主要是指当有事件到来时,程序才会执行。

每个线程维护一个消息队列,用于存储未处理的消息。当计时器到来时,按照先入先出的管理方式处理消息。同时,媒体服务器设置同种类型的多个工作线程处理消息,每个工作线程循环交替使用。同时为了保证线程的安全性,每个线程应维护线程结束信号量、是否创建分离线程、堆栈大小、消息队列最大消息数量、线程启动标识以及线程ID等参数。

五.视频彩铃的触发工作机制

1.被叫归属地S触发CAT AS(彩铃AS);

2.CAT AS向被叫用户主叫发送Invite,寻呼被叫,S触发MMTEL;

3.SCC AS进行被叫域选择决定在LTE进行接续;

4.被叫回复振铃(180),CAT更新彩铃SDP至主叫侧进行彩铃媒体协商,并触发IMS域彩铃播放;

5.被叫摘机,CAT居中发起Re-Invite流程,完成话路协商。

图 5视频彩铃触发机制图

小结

视频彩铃是VOLTE通信和视频业务相结合的创新,全球VOLTE网络的建设正加速成熟。据 GSMA统计,截至2018年3月,全球已有127 家运营商在63个国家正式商用了VOLTE视频彩铃业务[4]。VOLTE的商用为全球运营商增值业务的转型与创新提供了沃土,通过业务创新来驱动VOLTE发展和价值变现正当时。本文通过对VOLTE视频彩铃的网络结构进行深入分析,明确了媒体服务器在VOLTE视频彩铃系统中与其他网元的联系,设计了媒体服务器与彩铃系统中的信令服务器,业务流程和技术方案,从而实现视频彩铃的放音功能,同时降低由于图像传输错误而引发的错误扩展的影响。

参考文献:

[1]陈翠娥.基于VOLTE网络的视频彩铃[J].中国高新科技,2021(16):112-113.

[2]刘洪伟. 基于深度学习的超分辨率技术在视频彩铃媒体服务器上的应用[D].北京邮电大学,2020.

[3]马翔,徐延辉,王昊.视频彩铃业务流程与典型问题[J].数字技术与应用,2021,39(10):40-42.

[4]武红然,韩红蕊,陈志欣.基于VOLTE的视频彩铃实现与研究[J].科技风,2020(20):71.