“本文由 拍乐云创始人兼CEO赵加雨 撰写并投递参与由数据猿&上海大数据联盟联合推出的“行业盘点季之数智化转型升级”大型主题策划活动之《2021中国企业数智化转型升级先锋人物》榜单/奖项的评选。
作为拍乐云的创始人及音视频行业从业者,我从音视频行业的角度来分享我们对于数智化的观察和从业感受。2019年底开始的疫情给各行各业都带来了深远影响,其中比较大的一个变化是各行各业的线上化,疫情强迫人们把工作、学习、生活、娱乐等都搬到了线上,而这个影响不会因为疫情的缓解而减少,各行各业的线上化将会成为长期的趋势。(数据猿曾对外发布#榜样的力量#《新冠战“疫”——中国数据智能产业最具社会责任感企业》榜单)
音视频的“达克效应”曲线
“达克效应”描述的是一种心理学现象,通常新技术的出现和应用也符合达克效应曲线,即技术刚出现时会引来非常高的关注度和热度,此为愚昧之巅,但是过一段时间后可能因为达不到大规模商用的成熟度,或者没有找到应用场景等,导致进入绝望之谷,那么接下来随着技术更加成熟,会进入开悟之坡,最终会取得比愚昧之巅时更大的应用。
音视频并不算新技术,但随着网络、设备、各种新技术的发展,音视频技术也随之不断发展,在疫情之前,音视频互动一般只应用在视频会议、在线娱乐交友、在线教育等少数场景,疫情使得音视频技术迅速出圈,在各种场景下获得了广泛应用。过去两年的音视频技术也很符合“达克效应”曲线,可以说,疫情让音视频短时间内进入了愚昧之巅,各行各业都进入了线上化,而线上化离不开音视频技术。随着疫情趋于稳定,音视频的用量和使用场景大幅下跌,貌似进入了绝望之谷,但是疫情给生产端和消费端都造成了很多不可逆的改变,未来音视频一定会在更广的行业和场景里应用起来,即进入开悟之坡,最终的用量一定会超过疫情期间。
音视频赋能下的行业线上化
音视频技术的门槛高,涉及到的技术栈长,需要的专业人才多,因此需要第三方云厂商提供音视频解决方案。拍乐云作为一家提供实时音视频PaaS云服务的公司,在过去两年里服务了各种行业和线上化场景,也亲身感受到了其中的发展和变化。这里和大家分享一下我们看到的一些变化。(拍乐云曾以《视频矫正技术——基于参数估计的自由几何变换算法》荣获《数据猿·金猿榜年度榜单——2020大数据产业创新技术突破》)
疫情后我们看到了一个明显的趋势:音视频通讯成为大众沟通分享的重要方式。企业会议、远程授课、医生会诊、社交播客等场景越来越多,未来这类功能性实时场景将以更成熟的内容、更丰富的形式出现,而支撑这些场景的正是背后的直播和音视频技术。
娱乐行业作为线上化的先行者,一直热度不减,疫情让人们居家娱乐的需求快速爆增。一起听/一起看、视频社交、秀场直播、语聊房、在线KTV等等娱乐社交APP不断推陈出新,满足人们多元化线上娱乐的需求。这意味着音视频厂商不仅要保证优异稳定的音视频质量,还需要不断迭代底层技术以支持产品形态的持续创新。
我们看到疫情让教育的线上化得到了大规模的实践,虽然学科教育正面临政策的监管,但线上化的需求不会少,线上化的趋势也不会变。教育的线上化在一定程度上解决了资源不均衡的问题,而技术的升级解决的是线上教学的效果和效率的问题,让老师和学生能像线下面授一样身临其境,随时答疑、激励,甚至还可以像线下班课一样,有小组讨论和PK互动。
金融行业的线上化转型近年来也是发展迅速,出现了远程银行、视频客服、金融双录等各种线上化的业务场景。为了解决线上线下业务办理“零差别”,内部协同运营更高效的问题,音视频厂商也在不断地创新技术并深入场景痛点,为金融行业发展持续赋能。
物联网行业也在快速发展,万物互联,音视频技术成为必不可少的推动力,电话手表、陪护机器人、智慧车载、智慧家居、智慧安防、智慧工业等场景中都需要深度结合音视频技术,连接人与人、人与物。为了更好地适配不同的硬件终端,我们深度优化了音视频编码算法和引擎,适应各种低功耗、低内存等极限环境下的音视频通信。
我们还看到了政企行业在数字化、线上化转型中的决心和能力。在政策的推动下,我国信创产业发展迅速,成为了推动经济发展的“新基建”。作为音视频技术厂商,我们全力支持国产化,与麒麟软件完成兼容性认证,全面适配鸿蒙系统,为政企行业的数字化、线上化转型打造发展引擎。
沉浸式音视频加持数智化未来
音视频技术会随着AI、5G、AR/VR等技术的发展而发展,将会给用户带来更加沉浸式的体验,也将催生更多行业和场景来应用音视频技术。
AI技术对整个RTC行业带来的影响是非常深远的,客观地说,以深度学习为代表的AI技术的发展与成熟,对音视频关键技术的突破提供了另一个有希望的方向。有些使用传统技术无法解决的问题,可以通过与AI技术的融合,大大降低问题解决的难度。无论是RTC行业的核心音视频编解码,还是其他一些音视频处理和增强技术,比如现在比较热的音频降噪、视频超分、对象分割识别、语义识别等,在AI的加持下,都获得了突破,从而催生了智能客服、智能监控、虚拟形象等新领域。
5G浪潮的爆发正在为实时音视频创造低时延和高带宽的网络条件,这些基础设施的改进,为超高清视频、VR和全景视频技术的落地创造了可能, 这些技术将会给用户带来“身临其境”的沉浸式体验。大家一定有听过 Metaverse 元宇宙概念,它是 Meta+Verse 的组合,被定义为全新的“未来互联网形态”。而实时音视频技术在其中的应用,才刚刚开始,它会打破虚拟和现实的边界,将人与人之间的距离不断拉进,打造一个全新的数智化未来世界。
作者个人简介
赵加雨,拍乐云创始人兼CEO,音视频技术专家,资深程序员,足球爱好者,崇尚极简主义,简单就是生产力。东南大学计算机系毕业,从事实时音视频领域技术18年,精通音视频整体架构和技术。曾任Cisco Webex 美国架构师、网易云信 CTO等职,在14年外企氛围的熏陶后,2017年寻求改变,离开美国回国加入互联网云服务浪潮。2019年创立了国内第一家视频会议背景的实时音视频 PaaS 云服务公司拍乐云,深耕技术创新、场景研究和行业洞察,致力于为企业和开发者提供更好的实时音视频、互动白板、互动直播等产品,构建云上的每一次美好互动。