优酷于2022年1月正式提出“生产好内容、共建好行业、带动好风气”的社会责任战略。优酷追求的不仅是内容的精品化,更是通过绿色实践、科技创新、弱势关怀和文化传播,为用户带来多彩的生活体验,为行业树立健康的发展标杆,为社会传递正向的价值引导。
在弱势关怀方面,优酷希望服务好包括银发长者、未成年人、残障人士和边远贫困等不同社会群体的需求,先后推出了 “光明优酷艺术教室”“优酷无障碍剧场”“优酷银发剧场”“微光入梦·无障碍剧场乡村公益行”等一系列可持续的公益项目,并带动了越来越多的同行业者成为了公益同路人。
明星AI解说是优酷无障碍剧场的一个功能。优酷无障碍剧场上线于2021年12月3日,剧场致力于让全国1750万视碍用户可以像普通人一样平等地享受精神文明成果。优酷努力追求在新热影视作品上线平台后,可以同步推出无障碍版本,使得视障用户在优酷首次体验到了“追剧”的乐趣。同时,我们还举办了“寻找最酷的声音——视障者朗读展示评选活动”“阿炳杯-盲人器乐独奏大赛”等线下助残活动,我们希望有才华的视障艺术家能够在优酷平台被全世界看见。
说起AI解说,它缘起于我们在2023年9月为电影《不虚此行》举办的一场无障碍首映礼,在首映礼现场我们看到视障观众也有着强烈的追星需求。在与视障观众的交流互动过程中,导演刘伽茵一度哽咽,她说《不虚此行》原名叫《倾听》,在这场特殊的放映中,大家用另外一种方式接收到这部电影,“希望大家看完之后心里能有安慰和力量。”
在文娱产业全面拥抱AI的背景下,优酷看到了AI赋能公益的潜力,我们可以邀请有爱心的明星来为影视节目做无障碍解说,并利用AI技术将其延展到更多内容上,使得视障观众可以听到由她喜爱的明星为她讲述的影视节目。经过前后三个月的技术研发和产品打磨,明星AI解说功能于5月19日正式发布。
我们不仅制作了明星AI解说版,还制作了多部由普通视障朋友解说的AI无障碍电影。
研发AI语音解说的过程不是一帆风顺的,我们解决了很多关键问题,其中包括:如何高效分离人物声纹特征、如何准确模仿人物音色、以及如何让解说声音达到影视级清晰度等问题。经过探索,优酷自研了一套声音分离系统,结合了声纹聚类、背景音分离、语音降噪技术,构建了自动处理数据的完整管线;自研了音色训练大模型,实现了跨语种的灵活转换,减少音色泄露和不稳定性,可实现更高的人声相似度和情绪控制;我们还实现了模型训练采样率从16khz清晰度到48khz的清晰度升级,力求最终达到影视级别的声音清晰度。
每一部无障碍节目,我们都提供多个版本的AI解说,用户可以自由切换,但是这个切换会引起视频重新起播,体验存在顿挫感。这看起来是个小细节,但是我们力求把它做到极致,我们采用CMAF音视频分离技术,切换配音的时候只切换音频,视频一直保持播放,实现了声音的无缝顺滑切换。
通过在AI语音赋能无障碍剧场方面的探索,我们看到了AI科技与文艺的融合可以为残障用户打开一扇新的大门。随着AI的不断进步,我们有责任确保每个人都能享受到科技带来的便利,无论他们的身体状况如何。AI语音技术在无障碍剧场的应用,不仅是一项技术革新,更是一种人文关怀,我们相信“公益传善举、AI有温度、文艺触人心”。
弱势群体的关怀和信息无障碍的建设是一个长期过程,它需要我们每一个人的参与和支持。让我们携手同行,用AI科技的力量,为残障用户搭建起一座座通往艺术世界的桥梁。(作者王翼系阿里文娱ESG工作委员会秘书长)