页面

2014年7月3日星期四

哭笑不得的中文简繁体转换

時間:2014-06-19 11:04

关于简体字和繁体字的得失之争,半个多世纪来时起时伏,最近一度又声浪见涨。我由此想起最近好几年来,我自己在简繁体转换中遇到的困扰。不少使用电脑中文软件的人会有同感吧。

中文之难,难于上青天。没有哪个民族的文字像中文这么复杂。酷爱中华文明的人沉醉其中,赞美说每一个方块汉字都是一座“微型中华文化信息库”,但我等道行浅薄之人哪想得了那么深奥?而随着两岸隔绝多年后又重新接触,我们在海外必须与来自不同地域、使用不同汉字的人打交道,本来就难的汉字又增加了简体繁体的困扰——同是中国人,此岸认不全彼岸的中国字!

有弊就有利。中文简繁体难题,使得一批电脑软件人才喜获饭碗,简繁体互换网站和软件像雨后的蘑菇一样冒了出来:一篇文章脱稿,往这种软件上一放,一按“转换”,几千字、几万字,一眨眼就转好了。
一般来说,从繁体字转换成简体字还算简单——将意思相近的若干繁体字合并成一个简体字。繁体转简体的编程任务也就相对轻松:合二(三、四)为一,以“一”应之,大体上就不会出问题。

但任何事都有例外,有个别字,繁体变简体却是一分为二,这就顾此失彼了。“著”、“着”就是一例。繁体字中“著”,既是“名著”“著名”之“著”(念 zhu四声);又是“进行著”“盘算著”的“著”(念zhuo,或念轻声的zhe)。转成简体,后者就得写成“着”。编程高手若中文水平段位不够,“著” 繁体变简体,不是一律变“著”,就是一律成“着”。去看一些海外中文网站的简体字网页,不时就看见“着名学者”“世界名着”这样的笑话,也常常接到读者就此来函,指斥编辑文化水平太低——他们哪里知道,编辑用繁体字发稿,经过电脑系统的自动转换,刊发出来的简体,就给弄错了呢。
还有一种情况也让编程者挠头:几个繁体字合成一个简化字了,但某一种用法例外:“乾净”、“相干”“幹部”的“乾”“干”“幹”转成简化字之后,都是“干”,但惟独“乾坤”的“乾”,必须原封不动。在简体网页上,不时出现“干坤”也就不奇怪了。

这倒也罢了。简体字变繁体字,可就麻烦百倍。上面所说的“干”,简体变成繁体之后,就得有好几个分身——够电脑绞尽“脑”汁的。还有,简体字的“复”变成繁体之后,也得变成好几个:“複”(複雜、複製),“覆”(答覆、天翻地覆),“復”(復興、報復、復辟、復活、克己復禮)……
道高一尺,魔高 一丈。我前几年在一个叫“青藤书屋”的网站上用的简繁体转换程序,就堪称“智能程序”,能够根据上下文语境来判断某个简体字该变成这个还是那个繁体字,简 体的“复”啊“干”,转成繁体,都准确无误。不过,太聪明了,又免不了自作聪明。这个程序常常擅自超越简繁体转换功能,将一些大陆译法改成台湾译法,例如 “布什”改成“布希”,“希拉里”改成“希拉蕊”,“斯大林”改成“史太林”,“赫鲁晓夫”改成“赫鲁雪夫”,“卡斯特罗”改成“卡斯楚”,“悉尼”改成 “雪梨”之类,给文章平添一缕台湾文风。这本来也无伤大雅,但是遇到一些神经过敏的读者,就有理说不清。前一段见有封读者写信,就以此为凭,推断某个作者肯定“拿了台湾的钱”:明明是来自大陆,何以下笔将“戈尔巴乔夫”改成了“戈巴契夫”,这不是憋着台湾腔说话,有意讨好台湾金主是什么?
照我看,这其实多半与作者无关,而是编辑用类似“青藤书屋”这样的软件转码时失察,没有警觉软件会像俄罗斯民间故事中那一只热心得过了头的熊,用石块朝伙伴头上拍苍蝇,帮了倒忙而已。

有位朋友给我发来一篇从简体字转换成繁体字的文稿,我大惊自己堕落成了“文盲”,满篇不知所云!例如:“在惡性迴圈中無法自拔”,“到他這個年歲找個物件結婚不容易”,“從檔櫃裏拿出一份紅頭檔”,“三個田徑專案都是他的強項”……
反复研读,发现又是简繁体软件捣的乱,从简体转繁体时,自作主张将某些词易容:“迴圈”其实是“循环”,“物件”本来是“对象”,“檔”原文是“文件”,“專案”则是“项目”……

还有一句,更让我气不打一处来:“他的心賓士在長天廣宇”。这是人话吗?!拿出福尔摩斯的工夫才破解:“賓士”是台湾对于德国车Benz译法,而中国大陆译之为“奔驰”,这个软件从简体转繁体时,对简体“奔驰”的字样,不由分说一概置换为“賓士”!
几年前读廖亦武《上帝是红色的》,发现第2页印着“騾馬羊狗豬當街賓士”,呵呵,这就是简繁体软件搞的鬼:“賓士”,“奔馳”也。编辑不查,读者瞠目。

回到本文开头的猜谜征答。当我在一家网站看见繁体字的“鼓舞大家計程車氣”这句话时,只剩下哭笑不得。各位猜出是怎么回事了吗?
——台湾说的“计程车”,大陆民众叫它“出租车”,现在也受香港影响,用其英文taxi音译,称为“的士”……


高伐林附注:十几年来与简繁体转换软件打交道,没有哪一个是完美的,各有让我伤脑筋之处(多半是出在简体转繁体的时候),没有哪一个,是在转换之后可以放心,不用再全文复核一遍的。用去用来,前年我的朋友王清和向我推荐的一种,比较起来算是出错最少的,我一直用到今天,虽然也还有瑕疵,例如,简体转繁体之后,“撰稿”就 成了“譔稿”——这不算错字,却是基本不用的异体字;再例如,“只”就变成了“祇”,而现在港台也通常不用“祇”了。
这种转换软件,叫“文本处理”(textpro),可以在Google上打入textpro找到下载。

http://www.mingjingnews.com/MIB/blog/blog_contents.aspx?ID=0000000800000145

没有评论:

发表评论