毋庸置疑,随着5G时代的到来,直播行业将会上升到一个全新的高度。
直播行业的马太效应渐显
在十多年以前,这种可以跨越空间限制实现实时音视频交流的平台还只是一种奢求。在2G时代,只有图片可以通过彩信和邮件传播;到了3G时代,虽然视频通话渐渐成为了可能,但由于用户体验较差一直不温不火;直到4G时代来临之后,直播行业的发展突飞猛进,成了一时之间风光无两的超级风口,甚至还渗透到社交、泛娱乐、游戏、教育、医疗、IoT等各个领域。
2019年7月17日,直播巨头斗鱼正式登陆纳斯达克,在此之前,虎牙、映客、YY均已完成上市。随着直播行业的马太效应渐显,“烧钱换规模”的成长阶段已成为过去,与此同时,直播行业的竞争逐渐加剧,存量市场基本被瓜分完毕,而直播平台也为了刺激用户增长和付费转化,也在不断尝试新的玩法。
在这个节点上,以视频相亲为主的实时互动直播迅速走红。公开数据显示,视频相亲App伊对的日活用户高达百万,且每个月的用户新增速度在20%到30%左右。
实时互动,也就意味着用户需要在应用里通过视频或者语音实现互动行为,这对于直播平台而言绝非易事,除了自行开发费时费力以外,实时音视频技术本身的复杂程度也让直播平台很难保证提供给用户良好的使用体验。
因此,可以预见的是,5G时代的到来不只会让包括斗鱼、虎牙在内的直播行业重新洗牌,同时还让一批提供实时音视频技术解决方案的企业快速崛起。
实现实时互动 网路传输两大难题
在英国牛津大学的课堂上,一位教授上课的场景被高清摄像机捕捉,该画面先经过编码器压缩,再以分段发送的形式通过互联网传输到位于中国的学生的电脑上,最后由播放器进行实时解压缩,但这并非是单向交流,如果学生遇到不明所以的问题,可以通过实时语音向远在千里之外的教授请教,以及和世界各地的同学进行讨论,其延时通常维持在100ms以内,最低只有50ms。
能让这一切成为现实的,就是作为底层支撑技术的实时音视频技术。
实际上,无论是在牛津大学的互动授课还是视频相亲,本质上都相当于一个多人实时互动的直播间。
企业在实时音视频技术实现上通常会遇到卡顿、延时和音视频质量差等诸多坑,而且需要耗费大量的人力、物力和资源。技术门槛高,其技术上的难点主要有中间传输以及最后一公里传输两大难题:
中间传输即指从路由到路由的骨干网数据传输过程,这里承载数据传输服务的主要有光纤以及同轴电缆等渠道。然而,就像城市道路一样,一旦用户增加、流量剧增,在这些数据传输渠道里同样会发生数据拥塞的问题。因此,比较容易发生延时加剧、数据丢包等现象。
最后一公里传输主要指从Wi-Fi路由器或电信基站到用户终端之间的最后一公里传输,如果用户手机由于距离太远或者同时连接的设备太多而造成信号质量太差的情况,实时传输同样也会大受影响。
而上述问题都会造成在实时音视频通话时延时大、卡顿、画面模糊及听不清楚等问题。
除此之外,很多企业会选择出海,尤其教育、社交和游戏等领域,因此如何支撑跨国、跨海场景下实时音视频通话质量,接入节点在全球覆盖也是十分重要的。如果没有办法在某个地区提供在当地有质量保证的用户接入服务,产品则很难在该地区进行运营。
当然,这些还只是单纯的技术层面的问题,在真实的运营场景中,企业还要结合自己产品的特点、用户场景进行个性化技术开发和运维,这就需要耗费开发者大量的人力资源与时间成本。
在实时音视频领域,必定绕不开的一家企业就是声网Agora。
让用户通过线上实时音视频和互动直播创造出类似于线下面对面沟通的场景,是声网的初衷。从2014年发展至今,声网已覆盖全球15万注册App,日均提供超过8亿分钟实时音视频服务。目前,声网已经成长为实时音视频行业的开创者及领先者,全球最大的实时音视频专业服务商。
那么,针对实时互动中出现的卡顿和适配落地难等一系列技术难题,声网是怎么解决的呢?
首先,面对复杂的在线环境对实时音视频技术提出的新挑战,声网团队投入数年研发,针对不同的场景和环境进行技术优化,比如声网自建了软件定义实时网SD-RTN™,覆盖全球200多个国家和地区,专为双向实时音视频互动而设计,即使在网络条件较差的情况下,也能保证高质量传输和99.9%高连通率。
2019年,声网对东南亚、印度及南美等地区的传输覆盖进行优化,使这些地区的优质传输率已经达到95%以上,进一步提升了在线教育、泛娱乐等多种场景的互动体验。
其次,为了实现更多用户和开发者能够在声网的PaaS平台上的使用实时音视频服务,声网做到了iOS、Android、Web、Windows、MacOS、小程序及Linux等全平台覆盖和对6000多款终端机型的支持。
除此之外,声网的抗丢包算法可以完美实现稳定、流畅、无卡顿的直播效果,做到60%视频抗丢包,70%音频抗丢包,此数据为业界领先水平。
实时音视频技术 撬动众多新领域
早在实时音视频技术普及之前,声网的创始人兼CEO赵斌就已经预见其巨大的机会。
作为实时通信领域的领军人物,赵斌曾担任YY的首席技术官和WebEx的创始工程师,为了建立一种大众化的实时互动模式,他在2014年创立了声网,提供实时音视频云服务。
“声网一直在积极推进在线教育、社交、游戏、IoT和医疗等多行业客户和开发者。目前声网在不同行业应用中提供了100多个场景化解决方案并在持续增加。”赵斌表示。
近些年,随着智能手机和4G网络的彻底普及,每一年都有所谓的移动应用风口行业出现。
2015年,移动直播开始爆发,实时音视频技术为直播场景提供了有力地支撑,也为声网在直播领域的发展提供了机会;
2016年,以狼人杀为代表的手游出现爆发式增长,声网在不到半年时间内,几乎与国内所有主流狼人杀团队达成了深度合作,声网“专线”级别的传输质量,为狼人杀玩家提供了优质的实时音视频服务;
到了2017年,音视频社交场景逐渐主流化,声网与陌陌等社交平台联合打造了直播、连麦及游戏等全方位的实时视频社交方案,实时音视频技术再一次彰显出了优势;
2018年是IoT元年,声网SDK被集成到包括AR智能眼镜、智能手表、智能摄像头、智能门禁和机器人等各类IoT设备中;
在线教育在2019年呈现出指数级增长的趋势,在线教育领域一直是声网重点发力的领域,实时音视频技术的应用,为新东方、好未来及VIPKID等教育巨头的学员提供了可以实时互动的线上教学场景。
这些解决方案和交互功能,如果没有实时音视频技术的支撑很难实现,从某种角度上来说,也正是因为实时音视频技术的不断升级,才推动了这些风口行业的爆发。
实时音视频技术快速发展的本质在于用户对“实时”与“互动”的需求逐渐强烈,因此,除了直播社交和在线教育,实时音视频技术还被应用到了游戏、金融、医疗、企业协作和IoT等10余个行业,100多种应用场景。
在这些场景中,实时音视频技术所带来的改变可以说是颠覆性的,而这一技术或许还将会助推更多行业的发展。
“实时互联网”已来
随着诸多领域的创新应用场景不断涌现,实时音视频技术也逐渐成为最受关注的实用技术之一。
根据工信部和三大运营商的规划,2020年,中国5G将正式商用。事实上,无论是高清度、稳定性还是实时性,5G会让音视频互动有质的提升,这会与交通、教育、医疗及应急诸多产业相结合,实现落地应用。
同样值得注意的是,5G并不能解决丢包、延迟、抖动和终端性能多样性等互联网本身“最后一公里”的复杂问题,而这些问题在5G时代也将对技术提出更高要求。
因此,5G+产业的落地,离不开实时音视频技术的发展,换言之,5G可以改变现行的各个产业,但实时音视频技术就是助力5G改变各个产业的阶梯,也就是说,像声网这样专注于实时音视频互动解决方案的技术公司,也将会迎来发展中的高光时刻,凭借自身强大的技术研发能力打造真正意义上的“实时互联网”。
在刚刚过去的2019年,作为首家能将实时音视频技术应用到各行各业的技术服务商,声网实现了多项产品、服务革新及新技术探索全面落地,并且推进了业务和服务的迅猛增长,作为实时音视频领域的专家,声网不会止步于当前的状态。
那么,在5G时代,实时音视频技术具体是如何改变未来的呢?
一方面,是对传统应用场景带来的体验升级。声网创始人兼CEO赵斌在2019RTC大会上提到,5G可以让现在的应用释放更大的潜力,比如直播带货可以放大商品的细节,再比如Facebook尝试基于AR/VR改变社交体验。不只是直播、社交,游戏、视频、短视频、电商、搜索和地图诸多经典应用都会有新体验。
另一方面,也探索出更多新应用场景的落地。例如医疗与实时音视频技术结合也早有一些探索。2018年年底,重庆市推出120官方视频报警平台App急视救,就是应用了声网的实时音视频技术,这使得医患沟通时间缩短了80%,漏接降低50%。而5G低延时和高清网络的到来,则会加速这一场景未来更多的可能性。
除此之外,5G时代来临,AR基础建设也进一步完善,产业落地加速。声网的视频通话SDK也应用在亮风台AR智能眼镜中,用来解决智能制造等工业领域的远程协作场景。可以第一视角,第一时间了解现场制造情况、生产细节、有效提升效率和降低成本。
未来,实时音视频技术也会随着行业发展而应用到越来越多的场景中,实现业务的创新。比如,公检法也可以接入音视频技术,实现可视化执法、远程接访及视频庭审。民生政务方面,可以通过小程序接入技术,实现视频办事。
除了单一线上的支持,音视频技术也可以跟软硬件结合,形成一站式解决方案,未来,也会有越来越多的智能硬件产品接入实时音视频技术,像无人机、车联网、机器人和智能眼镜等,而两者结合后,又能将应用场景继续扩展到不同的行业里,通过组合,实时音视频技术也会完善不同的产业生态。
正如赵斌所说,未来声网还会将更多线下的真实互动场景搬到线上,构建新的线上世界。
在5G加持下,实时音视频技术最终会有多大的爆发力暂时不得而知,但这也是“未来”的意义所在。
来源: 子弹财经