迎接专业音频世界的AoIP时代
1 引言
AoIP(Audio over IP)是指在普通以太网上以IP(Internet Protocol,互联网协议)流的方式实时传送高保真数字音频信号的技术,可适用于包括现场扩声在内的诸多专业音频领域。它不同于VoIP(Voice over IP),虽然VoIP也用IP来传输音频,但其码率低,音质仅限于话音级水平,通常只能用于网络电话通信;另外,AoIP也不同于互联网音频,点播或直播方式下的互联网音频使用高压缩比算法,存在缓冲时间长、音质损耗大、容易丢帧等缺点,不适合对音质和时延有着较高要求的专业场合使用。
AoIP的高保真含义是指44.1kHz以上的采样率、16 bit以上的线性量化(通常是48 kHz采样,24 bit量化),以及低的延时(百微秒至毫秒级),且不采用任何有损或无损的压缩处理;这样的传输指标已接近于AES3和MADI标准,即便是毫秒级的延时也完全能满足会议、演艺、体育比赛等现场扩声的需求。
以太网是最常见的高速数据传送和交换的网络,是现代IT的基础。当前已进入百兆和千兆网时代,从理论上来讲,理想状况下的百兆以太网能双向对传各56个通道的24 bit/48 kHz的线性音频信号,而千兆网则超过了500路。人们也许找到了一个廉价高效的数字化之路,从而替代传统的模拟和数字电缆来传送和分配音频信号。
然而,以太网建立之初是用来连接计算机的,它遵循IEEE802.3标准,使用逻辑总线型拓扑结构和CSMA/CD来进行信息交换,这一点证明以太网天生就不是为传送实时音视频信号而设计的;IP更是伴随互联网而来,IP包传送过程中的不确定性更为提供这类服务增添了难度。必须提供某些机制来克服这些障碍:首先是同步,从网内各个节点进出的数字音频信号必须保证严格同步,否则,即便是细微的采样率偏差也会因缓存的枯竭或溢出导致数据错误;其次是流量的管控,这是实时音频流能够连贯不中断地从起点到达终点的主要保证,特别是当网路内同时存在其他类型的不可测流量时,这一点尤为重要;最后,在以太网和IP环境下必须对接入设备和链路进行有效的监测和管控,从而确保可靠性和可操作性。
这些都是AoIP需要面对和解决的问题,好在IP技术已经发展到了包罗万象、几乎无所不能的时代,其实不需要发明任何新的技术和协议, 就能巧妙解决这些所谓的难题。
· IEEE1588的全称是《网络测量和控制系统的精确时钟同步协议》,已被广泛应用于电力系统和通信系统的同步,IEEE1588能通过主从节点间时间报文的发送和误差测量,来实现两者频率和相位同步(见图1),精度优于100 ns,如果将此技术应用在AoIP的媒体时钟传递,同步已经不是问题。
· 目前企业级的交换设备基本都具备了服务质量(QoS)功能,能通过对以太网帧DSCP字段进行标识来区分时间敏感流量和普通流量,从而让AoIP流优先通行,以保证它的实时性。
· 利用IP通信技术对分布式的设备进行网络管理已非常成熟。总之,在较好地解决这些问题之后,开始跨入AoIP时代。
·
2 当前网络音频技术分析
利用以太网传输高品质的音频流其实并不是这几年才有的事,最早可追溯到20世纪90年代末出现的CobraNet,以及Digigram的EtherSound等,直到最近几年又陆续推出了AVB、Dante、Ravenna等新一代的网络音频技术。
2.1 CobraNet
1996年,美国PeakAudio公司推出了代号为眼镜蛇网络的以太网音频传输方案——CobraNet,该公司于2001年被芯片生产商Cirrus Logic收购,并以提供配套板卡和专用DSP芯片的方法将CobraNet迅速推广(见图2)。QSC是最早与PeakAudio合作并实现CobraNet商用的公司,首个固定安装的应用场合是迪斯尼动物王国,Cirrus Logic的介入大大降低了CobraNet的门槛,一些音频厂商开始使用CobraNet,其中包括Peavey、BIAMP、Symetrix、dbx等,媒体矩阵是CobraNet最主要的应用领域,Yamaha、Soundcraft等也在其数字调音台上添加了CobraNet接口,除此之外的应用还包括功率放大器和有源扬声器系统等。
CobraNet能够在普通五类网线上传输多达64路20 bit/48 kHz音频信号,并利用通用的以太网设备进行组网。其不同于传统系统的显著优点
是:在不改变布线的情况下,能够通过软件对音频通道的路由进行任意配置,既支持点对点,也支持点对多点,这种简洁灵活的特性使得CobraNet在各类中大型音频系统如机场、主题公园、商业中心、广播电台等获得广泛的应用。
与现有AoIP体系普遍支持标准IP不同,CobraNet使用了一套自有的专用方案:CobraNet以网络中某一设备(Conductor)不断发送节拍包(BeatPacket)的方式获得网络采样时钟的同步。虽然CobraNet也是一个同步网络,但它并没有使用主流的IEEE1588;CobraNet的音频传送是通过Bundle来实现的,Bundle是CobraNet特有的封装形式,Bundle不通过IP承载直接打包成以太网帧。虽然部分网管经由IP完成,但从核心技术上来讲,CobraNet只能算是一个二层(数据层)技术,并不能划在AoIP之列。鉴于上述原因,CobraNet存在以下缺陷或弱势。
· 由于Bundle与IP的潜在冲突,为了获得稳定可靠的应用必须为CobraNet建立独立的专用网络,并交给CobraNet去管理,这一点限制了它的推广价值。其实目前三层(网络层)QoS技术完全能保障AoIP与其他业务共网同传,从而可利用现成的网络来传输音频,这将节约大量的基础投入,并使系统变得简单高效。
· CobraNet是一个不公开的企业内部标准,近十年来,其核心技术并没有实质性的发展,技术与容量尚停留在百兆网年代,在带宽、时延、接入通道数量等方面已经没有了优势,与当今突飞猛进的IT相脱节,技术的差异性也导致它不可能与当前其他体系的AoIP系统实现互联互通,只能建立孤立的系统,即便是不同厂商间的CobraNet产品,也呈现出较差的兼容性。
2.2 AVB
AVB的全称是以太网音视频桥(Ethernet Audio/Video Bridging),是一项新的IEEE802标准,其在传统以太网络的基础上,通过保障带宽(Bandwidth)、限制延迟(Latency) 和精确时钟同步(Time synchronization),以支持各种基于音频、视频的网络多媒体应用。
AVB跨越了数据链路层和网络层等多个层级,涉及TCP/IP协议组的大部分层次,但其结构还是基本保持并兼容现有以太网体系,只是对其部分功能进行扩展,增加和修订的协议主要包括:
· 精准时间同步协议——IEEE 802.1AS;
· 流预留协议——IEEE 802.1Qat;
· 队列及转发协议——IEEE 802.1Qav;
· 音视频桥接系统——IEEE 802.1BA。
AVB为视频而生,因为视频的传输速率需求比音频大得多(24 bit/48 kHz音频码率约为1.2 Mb/s,1 080 p的HD视频达3 Gb/s,4K视频更高),因而对网络基础架构提出了非常苛刻的要求(如时钟抖动),AVB就是试图改造以太网的第二层来实现这一目标,完全意义上的AVB必须升级以太网交换机为AVB交换机才能实现。但如果只是单纯传输音频的话,为使用AVB而升级交换机显得有些浪费和得不偿失,因为除AVB外的其他AoIP方案都可以直接使用普通交换机。
AVB的研究始于2005年11月,几年前还比较热门,但随着专业电视领域SMPTE2022-6取代AVB成为发展主流,AVB的推广受到一定的影响,AVB在网络音频领域的应用也呈现停滞态势,相关的产品和系统仅限于较小的范围内。
2.3 Dante
Dante来自澳大利亚Audinate公司,是目前使用范围最广、拥有产品数量最多的AoIP技术(有超过300家授权厂商和800余种相关产品,其中也包括Hamann、Yamaha等)。Dante使用IEEE1588来进行音频时钟的同步,使用UDP进行音频数据流的传输并同时支持单播和组播;Dante拥有一整套完整的管理机制和流程:包括设备发现和配置、音频流的路由和切换、系统故障诊断和主备冗余等;虚拟声卡(Dante-virtual-soundcard)能将PC或MAC通过本机网口转换为Dante设备,省去转接环节而直接进行多音轨的录放;Dante在千兆网实测通道数(48 kHz/24 bit)超过400个,单跳时延最短为168.8 μs。
Audinate自身并不研发和制造音频设备,只出售核心板卡(BrooklynII)和芯片(Ultimo)给授权客户并提供开发支持,成熟的解决方案和便捷的开发流程使众多的音频厂商很快将他们的产品升级成支持Dante的新设备,大大加速了Dante推广的进程,这正是Audinate成功的秘诀;同时,用户还得到了额外的福利:由于使用相同的接口板卡和芯片、以及同一套管理软件DanteController,不同厂商设备间的互联变得非常方便,兼容性也比较好(见图3)。
然而,值得注意的是,尽管Dante有着这么广的市场占有率,至今却仍是一个不开放的企业内部标准,未来是否会重蹈CobraNet的覆辙,这确实是其面临的又一个风险,后文将继续这方面的讨论。
目前专业市场能见到的AoIP体系主要还包括以下几家(见图4)。
· RAVENNA:RAVENNA由著名调音台制造商L AWO旗下的AlC NetworkX于2010年9月正式对外发布。与CobraNet和Dante不同的是,RAVENNA一开始就是一个完全公开的AoIP协议,RAVENNA几乎具备了现代AoIP的全部技术特征,并成为AES67的制订基础(后文详述)。可惜的是,RAVENNA的使用者只局限于广播电视专业领域,并不被演艺行业的扩声技术人员所了解。
· Livewire+:Livewire首次亮相于2003年的NAB展,被视为最早的AoIP系统,归属于Telos联盟的Axial Audio,之后与RAVENNA合作并升级为Livewire+。Livewire+目前主要在Telos联盟内各子公司使用,并在广播电视市场占有一席之地。
· Q-LAN:Q-LAN是美国QSC音频产品有限公司为Q-Sys音频网络处理平台开发的第三代AoIP专有技术,相关产品包括Q-SysCore核心处理单元、I/O接口单元以及管理软件等,主要应用场合是包括迪斯尼在内的园区扩声系统。
· Wheatnet-IP:Wheatnet-IP是美国惠斯登(Wheatstone)公司自用的AoIP协议。Wheatstone的核心业务是研发和制造各类数字调音台及相关传输处理设备。
3 标准化之路
前文讨论了一系列的AoIP技术,这些技术是由不同厂商和机构在世界各地独自研发制订的,尽管都使用了类似的核心协议,如IEEE1588、RTP/UDP等,但由于技术路线与细节的差异,它们彼此之间相互独立,并不能互相通联,只能单独构建系统,这将大大限制未来AoIP的发展;同时,如果AoIP技术只是个别企业的自主技术,在安全性、适用性、经济性、可发展性等方面并不利于整个行业的发展。因此,制定与AoIP相关的公开标准,摆上了议事日程。
3.1 AES67-2015
AES(音频工程协会)代号为SC-02-12-H的标准化工作组,在2010年12月启动了一个叫X192的项目,希望在现有技术的基础上定义一个可互通的方案,以实现不同厂商AoIP设备之间的互操作,该标准于2013年9月正式颁布,取名为AES67-2013(AES standardfor audio applications of networks -High-performance streamingaudio-over-IP interoperability),此后又经过了一次修订,现在的版本是AES67-2015。
AES67从同步、媒体时钟、传输、编码成流、会话描述、发现服务、连接管理等方面阐明并规范了AoIP的机制和具体细则,特别是对基于IEEE1588v2的同步机制和RTP流的单组播传输方案作了明确的定义,这使得不同厂商AoIP设备和系统间的时钟对接和音频数据流对接成为可能。
2014年10月,媒体网络联盟(Media Networking Alliance)成立,由LAWO、QSC、Yamaha等8家公司联合发起,目的是致力于AES67的推广,在不到三年的短短时间内,已有RAVENNA、Livewire+、Dante、Q-Sys、Wheatnet-IP等几乎全部主要的AoIP体系正式宣布支持AES67,音频工程协会也于2014年10月和2015年11月在慕尼黑和华盛顿分别组织了两次AES67兼容性测试,测试结果表明不同厂商AoIP产品间的互通性还是令人满意的。
在国内,由中央人民广播电台牵头的GY/T 304-2016《高性能流化音频在IP网络上的互操作性规范》行业标准已完成审核,该标准采自AES67-2015,并于2017年1月4日正式由国家新闻出版广电总局批准发布。
最后特别需要指出的是,AES67仅定义了涉及AoIP互联互通的最基本部分,解决的也只是最简单的单播和组播流的对接,并不是AoIP的全部。与AES/EBU、MADI等传统数字音频接口技术相比,AoIP复杂得多,涉及设备发现与配置、信号调度、监听监测、诊断分析、冗余备份等诸多方面,需要一整套完善的网络管理机制,对于这些AES67并没有给出明确的说明,目前仍需要各个AoIP体系自己去定义和实施,比如Dante只是开放了部分BrooklynII节点去发送和接收第三方的AES67音频流,除此之外,保存了原有的完整架构不变。从这种意义上来说,AES67更倾向于用在不同AoIP系统之间作桥接,而不是只用AES67就能独立构造完整的AoIP应用系统( 见图5)。
3.2 AES70-2015
AES于2016年1月又发布了一个与AoIP有关的标准——AES70-2015,它的全称是《面向网络音频应用的开放式控制架构》(AES standard for Audio applications of networks -Open Control Architecture)。从字面上看,应该是一个利用网络对音频设备进行控制的标准。
其实,AES70来源于OCA联盟,它由Bosch、TC、Yamaha 等9家公司发起,OCA于2014年底正式成型,随后成立AES X210 工作组,负责将OCA1.3转化成AES70-2015。
一般来说,音频技术人员对MIDI都不陌生。MIDI是一种乐器数字接口,它并不传递任何音频信号,传输的是音符、音量等MIDI控制信息。而AES70就好像是AoIP域的MIDI,它以IP方式在入网的数字音频设备及非音频设备之间传递各类控制信号,以达到监测、控制和管理的目的。AES70提供了一个非常完备的基于IP网络的音频监管框架,具备良好的安全性、可用性、鲁棒性(robustness)、兼容性、以及可扩容性和可分析性。
前文提到AES67解决了AoIP流的对接问题,在控制层面上却存在较大的空白,因此AES67可称为“Audio Streamover IP”,而相反,AES70是个控制协议,即“Audio Control over IP”,两者的结合AES67+AES70才可能成就一个完美的AoIP。通过AES70,AoIP系统能完成网络中的设备发现、媒体流的监测和拆除、设备的配置和操控、系统的监测和管理等AoIP的控制功能;另外,AES70除了支持AoIP外,还能广泛应用于基于以太网的音频设备的监测和管理,包括信号处理(增益、动态、均衡、混音等)、电平监测、频谱分析、快照管理等,甚至还能对设备进行远程复位和升级。
现在,AES70的开发和推广刚刚启动,前景和成效拭目以待。
4 AoIP应用展望
当今科技发展的趋势,IP化已经是不可抗拒的潮流,经由物物相联,IT思维已开始渗透到了每一个行业,这种跨界发展的结果,对一大批行业将产生颠覆性的影响,甚至推倒重建。IP之所以具备这么大的威力,是因为在其背后隐藏着人类的智慧和无尽的可能,因为通过IP可将万物聚为一体,并连接云计算和大数据,才能发挥出不可想象的功效,IP是开启人工智能时代的一把钥匙。
AoIP的出现为专业音频走向IT扫清了最后的障碍,是融入IT大家庭的入场券,专业音频因此也能共享到IT发展带来的种种福利和变革,下面笔者就AoIP未来在专业音频领域的应用,作一个简要的分析和展望。
· 随着越来越多的数字音频设备具备AoIP接口和功能,专业音频系统的物理架构和构造方法将发生重大变化。目前已经出现一大批带有Dante接口的数字调音台、功率放大器、有源扬声器系统,甚至是无线传声器,而且发展呈上升趋势,主流媒体矩阵也大多具备了类似的接口;一根超五类或六类电缆可容纳数以百计的原汁原味的低延迟音频通道,如果将这些AoIP设备通过网络交换机连接到一起,便组成了一个海量信号池,每个通道信号均能做到按需调度和分配。由于这种分配是通过IP流在网络中的软路由实现的,并不会占有具体的物理线路,这就省去了以往搭建系统过程中需要架设的大量的模拟和数字电缆(只需要将每个设备用一根网线就近接入交换机即可)。线路复杂度和成本大幅下降;系统规模可以做得更大;拆除、添加或更换设备变得异常容易;能够根据具体的环境特征建立相应的传输拓扑结构,比如舞台和控制室星形接入,再将两者集中互连。另外,现有的AoIP系统都已具备了主备冗余的功能,通过成熟的网络备份技术,就能应对安全性要求苛刻的场合(见图6)。
· 系统的整体性和协调性得到强化。随着AoIP标准化时代的来临,每个专业音频系统都将有条件设立统一的网管,经由网络集中完成在线配置、路由、监测、诊断等管理任务;能够通过软件来定义各类应用,以前只对单一设备能进行场景的预设和加载,而现在则可以对整个系统进行个性化参数的统一定义和切换,比如一个剧场能通过软件快速在会议、音乐会、演唱会等模式间切换;通过网管,还能调度所有设备协同完成整个系统音频参数的优化,如啸叫抑制等;通过网管,能集中监测监听系统内各设备的实时工作状态,并开启自动报警,实施灾备切换。
· 迈向更高的智能化。专业音频将遵循从模拟到数字,进而通过网络化最后迈向云化和智能化的发展历程。未来也许真的可以用云来构建音频系统,而传统的音频处理都将是云计算空间内的虚拟物件,只留下AoIP来联接传声器和扬声器。
选自《演艺科技》2017年第2期陈武,高天增《迎接专业音频世界的AoIP时代》,转载请标注:演艺科技传媒。更多详细内容请参阅《演艺科技》。