姓名里的生僻字,让我成为数字时代的「隐形人」

2023-06-24 星期六

「适配需要成本,大家都不动,这件事就没有实现的可能」,搜狗输入法 2022 年去寻找厂商合作时,吃到了不少的闭门羹,「这不是我们 KPI 里最重要的事」。

尽管生僻字影响着 6000 万人的生活,但解决生僻字问题,却几乎带不来任何的商业利益。在互联网公司都在「降本增效」时,生僻字的改造很难被划在优先级更高的位置。

而此时,生僻字在搜狗输入法内部,已经与无障碍化的改造划上了等号。搜狗输入法 CEO 鲁剑告诉极客公园,从 2023 年开始,公司的 OKR 里面除了用户增长和商业价值之外,多了一项「社会价值」。

事实上,搜狗输入法至今一直处在亏损状态。「在腾讯内部做一个亏损产品,确实是有压力的」,鲁剑说。但好在,过去搜狗输入法做的通过眼睛控制输入的眼动仪,2022 年搜狗输入法重投入的「众声无障碍计划」,在社会价值层面都有其回报,也契合近几年腾讯力求的,投入更多钱做更多有社会价值的贡献。

这些支撑搜狗输入法去做市场上第一家快速响应投入到解决生僻字问题的商业公司。而随着新中文编码字符集将在今年 8 月 1 日开始强制执行,生僻字的解决开始变成一件「不得不」解决的问题。

从解决编码到让各个场景都支持,这是一条走了很久的路。

一群以商业银行、相关政府机构、微信支付宝相关人士,受生僻字所困扰的普通网友共同创建了的「生僻字交流群」。群从 1 个扩散到两个,如今已经超过 700 人,他们在群里提供尽可能的帮助,从各个平台如何解决生僻字认证,到具体的生僻字编码,在处理各类公共事务时可以采取的方法,在这里,可以围观到「一个普通人因为生僻字导致的充满麻烦的一生」。

事实上,系统对字符的支持分为数据库和客户端,能输入却未必能显示。腾讯搜狗输入法早在 2021 年 11 月就上线了「生僻字键盘」,这个特殊的输入法拥有笔画、拼音、「拼音+笔画」三种输入方式,帮助生僻字都能被打出来。但在不同的手机系统、电脑系统,甚至不同的 APP 中,显示仍然是一种麻烦。

让生僻字显示,手机厂商起至关重要的作用。鲁剑举了一个例子,集成生僻字虽然不会影响手机的运行,但假设字库分别搭载在各个手机软件中,一个 10M,100 个手机 APP 就会用掉 1 个 G,字库占据的内存就会指数级增加;但假设是厂商接入,那各个产品就可以直接调用厂商字库,「厂商一旦适配,下面的各个应用的适配就水到渠成,产生多米诺骨牌的效应。」

但问题仍未被完全解决。在未能有统一的国家标准时,「一字多码」的状况层出不穷。在不同系统之间,统一生僻字的代码一旦不相同,仍然会出现无法显示的问题。「王莹」在搜狗输入法使用的 PUA 码与户籍系统仍不相同,PUA 码(Private Use Areas)是解决未被 Unicode 标准收录文字,在某些特定场景使用文字的一种方法,搜狗输入法、乃至户籍管理系统中,都存在这样的 PUA 码。这样的状况同样需要时间去一一解决。

另外,8 万字的新标准还未能囊括全部的汉字。2023 年 4 月 20 日,腾讯联合工信部电子工业标准化研究院等发起的生僻字征集小程序,第一天就收到用户提交生僻字 1404 个。提交次数最多的是陕西知名的 biangbiang 面,有些人用手写,有些靠拍照,更多人参与进来试图让更多汉字留在中文数字世界。

这些都是问题正在被解决的信号——很多人也都不再需要主动或者被动地换掉名字。曾頔初中升高中时,正值全国统一更换户口本。工作人员找不到「頔」,就打成了「硕」,直到中考前夕这个错误才被发现,「差点耽误了高中升学」。折腾许久,换回来后,她的户口本上就多了一个她从未用过的曾用名:曾硕。

工作时她也有一个「替代名」,单位打卡机上也找不到頔,她只好选取别的汉字代替,胡乱选了「曾翟」,这个名字陪她打了四年卡。8 月新标准强制实施后,意味着生僻字问题有了第一条休止线,在数字化的世界中,像曾頔一样的人找到自己的名字未来就不再是问题,也不应该是问题。

原文地址:点击