在中国超过10亿奥运潜在观众中,有一个群体长期被忽视。他们是7200万位听障者——由于电视直播节目缺少字幕,他们无法和健听人一样,随时收听现场解说和赛况。
这一情形,今年发生了变化。通过新近研发的字幕辅具,数百位听障者第一次在电视机前实时收看奥运比赛。一位北京的听障者,看见杨倩为中国夺得首金后,情不自禁欢呼起来。
有了实时字幕后,一位听障者说,“世界从此同欢喜。”少为人知的是,这一刻来之不易,中国残联及一群社会爱心人士已为此接力奔走30多年。
今天,《南方人物周刊》推送一篇原创报道,带你了解背后的故事。
电视实时字幕,中国聋人协会主席杨洋盼了21年。
1999年,作为中国普通高校第一位全聋大学生,杨洋加入中国残疾人联合会,她着手的第一项工作就是“推动给新闻节目加配字幕”。更早之前的1989年,中国残疾人联合会成立初始,便向中国政协提交了该提案。
20多年来,包括杨洋在内的许多听障者几乎每年都为字幕呼吁奔走。在他们眼中,字幕,是连接无声世界和外部最重要的桥梁,是听障者生活中的光亮。
进步在不断发生:2003年,春节联欢晚会开始在重播时最大限度加配字幕;2004年,春晚第一次在重播时为全部对白加配了字幕;后来,大部分非直播新闻节目为主持人讲话外的内容加上了字幕……然而,受到技术等诸多因素的限制,对于直播节目,实时字幕始终未能实现。
2018年,中国聋协换届,杨洋进入最后一届任期。想起未竟的心愿,她抱有极大的遗憾,“我到北京来,到残联来,开始做的第一件事,没做完。”
▲中国聋人协会主席杨洋在办公室
转折发生在2020年。在杨洋的影响下,在广电领域工作多年的开发者宣振生,采用阿里巴巴达摩院免费提供的精准语音转译能力,为听障群体研发出了一款可连接电视机、电脑的字幕盒子,它能将AI实时生成的辅助性字幕与节目画面同屏呈现。
借助字幕盒子,数百位听障人士第一次在电视机前看懂了新闻联播、春节联欢晚会、奥运直播。中国第一位聋人记者孔军强曾撰文记录感受——“难忘今宵,世界从此同欢喜。”
见证字幕盒子一步步问世、投产,杨洋激动地说,“虽然还没有成功,但总算有个交待了。”
与世界的缝隙,在杨洋4岁时突然出现。
和许多听障者一样,因为感冒发烧,她接受了常规的打针治疗,但没想到,声音在她的世界里逐渐黯淡,直至完全消失。
不甘心的杨洋和父母,一次次对抗命运。借助汉语拼音,杨洋通过模仿父亲的口型和舌位学会了结结巴巴地说话;通过观察嘴形变化,她学会了读唇。唇语第一次帮她缩小了和有声世界的沟壑,但和生人交流,她依然“如临大敌”:每一个人的唇动习惯都不一样,有人说话时嘴唇几乎不动。
凭借极顽强的毅力,杨洋在普通学校读完了小学、初中,并以全校第一的成绩考入杭州市重点中学——杭州市第十四中学。高考时,由于当时普通高校不招收双耳失聪者,杨洋经历了无数曲折与反复:体检不合格被取消招生资格后,他的父亲向中国残联写信求助,杨洋的各个母校甚至街道办都为她的事奔波。
最终,经过中残联、浙江省教委、浙江省委等领导批示,1992年9月20日,在开学大半个月后,杨洋得以进入杭州大学攻读数学专业,改写了中国听障者的求学史。
缝隙第二次缩小,是38岁,植入人工耳蜗后。这些年来,在政府和残联等社会各界的推动下,人工耳蜗的推广卓有成效。近10万名听障儿童接受了人工耳蜗植入手术,随着越来越多的新生代听障者在一定程度上“能听会说”,“聋哑人”一词被聋协列入不当用词中。一有机会,杨洋便对外宣传,听障者并不“哑”,经过康复训练,大部分听障者可以开口自我表达。
杨洋的听力也在一定程度上得到复建,尽管经常还会听不清、听不懂,说话口音常被误认为是“韩国人”,但结合读唇,她已能流畅地面对面与人交流。
杨洋始终惦记着另一件为听障者谋福利的大事——字幕。她相信,在人工耳蜗、字幕等科技手段的帮助下,加上口语训练,听障者完全可以像健听者一样融入社会。
《中国残疾人事业研究报告(2018)》显示,中国残疾人总量已超过8500万人,其中听力残疾人超过2000万,且每年约有3万听障儿童出生。如果加上听力衰退的老年人群体,听障人群规模更加庞大,达到至少7200万人。
对很多健听人来说,字幕或许可有可无,但杨洋坚持,对7200万听障者来说,字幕,是刚需,是通向真实世界的钥匙。
“很多人不理解,新闻稿、讲话稿随处可见,为什么听障群体还一定需要实时字幕?”杨洋解释,“事后整理的稿件经过了人工编辑,而实时字幕原汁原味,包含的信息丰富、完整,也能更好地呈现讲话者的个性。其中,新闻字幕尤其重要,相比电视剧电影,它们不是虚构的,是真实发生的现实生活。”
▲北京一位72岁的听障者首次通过实时字幕收看奥运会
由于长期生活在“打着马赛克”的信息环境中,很多听障者内心逐渐封闭,成为社会边缘人。他们,始终和外界隔着一层“玻璃墙”。
与其他残障者的处境不同,听障者面对的墙是“隐形”的,他们四肢健全,看起来与健听人无异,因此常常引发误会和隔阂。
杨洋举了一个例子:医院有爱心通道,除了老年人、孕妇、肢体残疾人等群体外,听障者也会去排队,却经常引发不满,被投诉“走错地方了”,但他们难以为自己辩护。医院、银行等排着长队的场景,是听障人士的噩梦。
墙也常常在听障者内心构建起来。“当你在工作、生活、学习中,连电话都不能用,你会觉得自己很没用。所有寻常的声音,无论是铃声、火警、还是《新闻联播》,对我们来说都好像触不可及,这时候会觉得我们跟社会的距离有点远。”
“只有消除了信息不对称,才能打破这道墙。”杨洋说。
2016年,工作中一个偶然的机会,开发者宣振生与杨洋结识。
宣振生,90年代末毕业于计算机应用专业,从一家安稳的国企辞职后,他独自从老家河北来到北京中关村闯荡。北漂的日子里,他在国际知名IT大厂的代理公司工作过,创过业, 2007年踏入广电技术领域,终于在北京扎下根来。
▲创业者宣振生
在广电后期制作领域深耕多年,宣振生知道,加字幕向来是“辛苦”且“乏味”的工作。但直到与杨洋深入交流,宣振生才意识到,“原来字幕这么重要”。
从那时起,宣振生开始有意地深入研究字幕技术。2018年,宣振生同中国残联无障碍环境建设推进办公室、清华大学无障碍发展研究院、中国国际电视总公司等单位代表专门赴日本考察字幕技术及应用,回来后就服务于听障群体的“说明性字幕技术”形成了报告。同年,他为全国人大代表、中国残联副主席吕世明的人大提案及全国政协委员、中国残疾人艺术团团长邰丽华的政协提案提供了技术内容,呼吁电视台为听障人士加配实时说明性字幕,但因电视台始终对字幕要求极高,方案难以落地。
2019年,宣振生想到了一个两全的办法:为听障人士研发一款专用字幕盒子,这样,拥有盒子的听障者能够拥有实时字幕,而健听者的电视屏幕也不受影响。这样一个过渡性解决方案,能够解听障人士的燃眉之急。
宣振生的想法得到了残联和聋协认可,但当时一起创办公司的股东,没有一位支持他。大家都没做过嵌入式开发,觉得风险太高,且商业价值小。只有宣振生坚持要做。他只身退出公司,租了一间简陋的办公室,开始新的创业之旅。他时常感到某种“使命感”,觉得自己“被选中来做这件事”——很少有人像他一样既懂字幕技术,又了解听障群体的需求,而且“愿意折腾”。
在设想中,做一个字幕盒子并不难,“六七十万投入应该能搞定”。宣振生花了两千多元,买了三块开发板,想着在上边写程序就能完成整个架构。没想到,他低估了难度。投入几乎成了“无底洞”,盒子研发过程中,他踩过两三个外包公司的坑,因为逐渐发不出工资,招聘的开发工程师陆续离职。
他只好把被褥搬进办公室,绝大部分事情亲力亲为,有时在办公室一住就是半月,连做梦都在设计方案。在两位基本不拿工资的兼职技术合伙人的协助下,盒子的技术方案终于出炉。
硬件试制及量产也是一笔巨大开销。宣振生几乎每周都要从北京往深圳跑,寻找愿意试制生产的厂家。一般的工厂不愿意接受少于3000件的小批量生产,只有一个电子厂的老板接了单——他是位残疾人,深知残障人士的不易,因此愿意帮助宣振生。
为了维持公司运转,宣振生孤注一掷。积蓄花完后,他抵押了北京的房产,还跟朋友借了不少钱,个人总投入近200万元。他成了朋友眼中“很傻很天真”的中年男人,有人劝他,“如果你实现了财务自由,你可以去做这件事,但现在你没有。”
经历了无数次内心摇摆,宣振生选择了坚持——至少不愿意半途而废,听障者圈子里已有很多人知道他,并且愿意成为用户来支持他,“一定要有个交待”。
好不容易把硬件解决了,还有一个成本大头,语音算力没着落。
宣振生最初接洽了一家公司,报价他承受不起。直到2020年5月,宣振生通过朋友联系到阿里巴巴达摩院语音实验室,他试探性地问,“能否以成本价提供语音算力?”对接人是工程师唐璐,在日本工作过多年,东京的无障碍环境给他留下深刻印象。了解到服务使用者主要是听障群体后,唐璐立刻在阿里内部写了详细的材料,很快为宣振生申请到公益的语音算力。
▲达摩院语音实验室工程师与宣振生
讨论字幕盒子技术细节
“为了让听障用户更好地收看电视直播,达摩院语音实验室还专门做了大量研发工作,针对新闻、娱乐、访谈等不同电视节目类型,以及娱乐口语、方言、俗语的特点,做了数十万小时时长的标注,成本达到几百万元。”唐璐说,经过专门的训练,达摩院语音AI识别新闻联播等节目准确率达到99%以上,在第三方评测中排名最高。借助语音AI,听障者不仅可以收看中文节目,还能跟着国际台学英语。
2020年6月,第一批字幕盒子问世。这个小小的盒子,和手掌一般大,却凝结着多方社会力量投注的心血,承载着千万听障者30多年的夙愿。
在杨洋看来,字幕里蕴藏着“连接的力量”。
对于受过教育的听障者,这种连接,最为简单、高效,相比难学的唇语、非标的手语,字幕不仅解码速度快,信息量丰富,且实现了完全的标准化。
她主张,应该让听障朋友们尽可能享受“信息带来的冲击”。当这种冲击足够多元,听障者的世界也会变得开阔、丰富起来。
▲听障者通过字幕盒子收看节目后竖起大拇指
春节前,一位爱心人士购买了100台字幕盒子,寄给全国上百位听障人士。几乎每个人都收获了前所未有的体验:
16年前春晚《千手观音》舞者吕晓燕,第一次在大年夜和家人共享了同一份欢乐和感动,她在电视机前被岳云鹏的相声逗笑;
北京一位喜欢抗日战争片的老人,第一次在电视上看懂了《铁道游击队》,小时候因为看不懂无字幕的老电影,他常跑去新华书店翻小人书消化剧情;
重庆沙坪坝区磁建村150多名聚居的听障者,集体观看了《新闻联播》等电视节目,现场不少人竖起大拇指;
很多因为疫情焦虑不安的听障朋友,在电视上收看了实时的新闻发布会,第一时间获取了疫情一手资讯;
还有年轻的听障者,动手拿盒子连接电脑,第一次体验了带字幕的网课……
▲字幕盒子第一批听障用户收看新闻、娱乐等节目
杨洋期望,字幕能够在更多的地方发挥作用,像“盲道”一样,成为无障碍社会中的一种基础设施。尽管有些场景识别难度较大,但她期望有条件的地方能让字幕先跑起来——听障者阅读速度极快,字幕准确率达八成即可理解大意。
杨洋和许多在北京念大学的听障学生聊过,尽管一线城市生活压力很大,但他们都不愿回老家工作。“为什么?因为相比二三线城市,大城市的信息无障碍做得更好,这里的电子屏幕更多,公交车、地铁上都有报站屏,不用分辨嘈杂的环境音,看字幕一秒钟就搞定了。”
在各方的努力下,听障者身处的环境正在不断进步。
今年3月,宣振生研发的“实时字幕机顶盒” 被海南省残联纳入《残疾人家庭无障碍改造参考目录》。接下来,他期望引入投屏等功能,让盒子覆盖更广泛应用场景。
▲字幕盒子“今声优盒”
4月,同样采用达摩院语音技术,钉钉为中国聋协搭建起无障碍工作平台,聋协 31个省份、80多个城市的工作人员从此可以利用实时字幕在线开会、直播。之后,无障碍平台还将向更多听障群体开放。
目睹越来越多“声音缺失”带来的空白被字幕填补,越来越多的听障者因此实现了过去不敢想象的心愿,杨洋常常想起第一次看见新闻实时字幕的情景——那种“冲击”比装上人工耳蜗时还要巨大。
身为听障群体的代表,杨洋常常需要公开演讲和接受采访。“能开口说话”已让外界惊叹,但她仍隐隐为自己的口语感到自卑,和很多听障者一样,那种不自信被刻意藏得很深。
直到连上盒子,看见实时字幕随着说话人的表情动作一串串在画面上蹦出来,她才发现,“上当了”——原来健听人的口语并不像书面语那样完美,他们说话时也会有大量“嗯”“呃”的语气词,也会打磕巴和词不达意。
“原来他们和我一样,你能做的我也能做。”她说。
原文地址:点击此处查看原文