2020年3月23日 来源:读读日报
真庭正宗,Video Gamer|Interista
没想到现在还有人会想知道汉化相关的事情,很是欣喜。
我前几年的时候曾经发出过这样的感叹:
也许这个年代,留给汉化组的灰色地带已经越来越少了,各位的热忱和对文化产品的喜爱已经无法承担违反法律带来的风险,汉化组也许已经完成了自己的历史使命,在版权普及的浪潮中,是时候再一次审视自己所处的环境以及掂量可能面临的后果了。
目前大部分的海外文化产品,在我们强大的消费能力和广阔市场的诱惑下,都是削尖了脑袋想往里进来。大部分游戏产品,虽然面临严格的审查和政策约束,也总有各种曲线救国的方式到达中国消费者的手里。所以现在的海外游戏产品自带中文已经是非常司空见惯的事情,早期的游戏汉化者们要么正规化加入了真正的官方汉化组织,要么就因为年龄工作的关系淡出这个圈子,在需求极度缩小又面临越来越严厉的法律风险的今天,游戏汉化组已经是非常稀有的存在了。
(注:本文谈论的都是民间汉化过程,官方汉化个人也有参与过,过程要简单很多,主要靠的是翻译人员和管理人员,没有民间汉化那么多有意思的过程)
本人有幸在游戏汉化需求旺盛、民间组织兴盛的年代,见证过这一令人痛苦而又感动的时期。痛苦是因为大部分的优秀游戏都天然有着语言的壁垒,无法领略其100%的魅力;感动的是你能看见前赴后继的民间汉化者们,凭着无以伦比的热情持续地对游戏进行汉化,至少在我所知的范围内,99.9%的民间汉化人员是完全靠着一腔热血在坚持。我也参与过一些大小型的项目,既有担任单纯翻译的作品,也有参与从策划到测试整个流程的经历。所以我觉得对这个问题,算是有一定心得吧,抛砖引玉,希望能看到更多在汉化组中扮演过不同角色的人来分享他们的经历。我相信对保留这个绝无仅有年代的记忆是个很有裨益的事情。
游戏汉化组与字幕组的工作存在非常大的不同,后面我会详细讲述,游戏汉化的难度与体量要远远大于影视剧的翻译。
先回答题主列的几个问题:
汉化组应该有一个特别牛叉的软件,能够提取出游戏里的所有文本,之后通过机翻和人工校对后又可以直接套入游戏里去,这样一款游戏就汉化成功了。(纯属意淫…ಥ_ಥ)
提取游戏文本是一项非常有技术含量的事情,涉及很多方面。我后面会详解,但是难以实现你的这个假设的最主要原因就是,游戏的加密方式是不同的,你无法使用一套解密方式去对应所有的游戏。而且游戏文本放置的结构每个游戏也会不同。然后导出的文本用机翻是一个办法,但是效果一般都很差,先不谈机翻本身应对复杂句子和暧昧表达的能力,民间汉化导出的文本中会存在大量的指向代码、着色代码、排版代码,会把整个句子切分得七零八落,所以机翻没办法正确识别,翻译效果很差。
导入就更是有难度的,因为还会涉及到一个很多人不了解的因素:字库容量。总之就是没那么简单。
那么题主的几个疑问:
1.是否存在类似的软件?
存在。破解人员会针对游戏编写解包工具、导出工具。翻译、润色人员会有文本对照软件。
除这些专用的工具以外,还有美工会使用大家熟知的图像处理软件,测试人员会使用模拟器。
2.游戏里的文本是怎样提取出来的?
游戏里的文本通常是加密存放在游戏解包出的文件里,只要破解人员破攻破了游戏的加密方式,找到了文本位置,就可以自行编写一个导出工具导出文本。
3.为什么会有乱码现象?
因为字库对应和文字编码问题。
4.为什么不把汉化做成png图片直接贴进游戏里?
因为效率很低,不易修改,还会面临内存溢出等等运行上的问题。
总之,汉化是一个挺烦人、挺复杂的过程,不过还挺有意思的,我接下来详细介绍一下我从各种项目中总结出来的流程,具体到每个环节。(当然我并没有实际参与过的一些流程比如破解、导入、美工,我只能按照我的理解来说明,不一定准确,也不够详尽,期待各位专业人士的答案)
一款游戏的汉化从开始到结束,主要会分为3个大的时期,若干个工作程序。我做了一张简易的表格,大致能够展现主要的基干和各部分主要的工作内容。
玩家印象中,汉化工作最主要的部分应该就是图中“主流程”的这个部分。实际上,对于一款游戏的汉化来说,我认为最为关键的是前期的工作,而如果能够走到主流程这个阶段的,一般来说完成只是时间问题(当然还有用爱发电的人们的精力、坚持)。
不是所有的游戏汉化都完整全部走完这个流程。根据游戏类型、组织形式的不同,会有所出入。我参与的大部分是RPG游戏的汉化,这是汉化需求最迫切的游戏类型。RPG的汉化,大致上都是按照这个流程来的。
好,接下来让我们来详细介绍一下每个环节。
前期
这是决定一款游戏是否真的能够汉化的关键时期。
意向/立项
一款游戏要让人产生意向走向汉化,一定是具备一定人气、游戏素质过硬的作品。如果没有人气,就无法产生立志汉化它的爱好者,而参与汉化的爱好者的热情与坚持是汉化能否成功完成的重要因素;素质不高受众不多,汉化者的动力也会不足,我可以很负责任的说,除去想向广大玩家安利自己喜爱的作品以外,虚荣心也是一个很大的motivation(笃定),不逐利,也就逐个名儿嘛。
当满足了这些条件,热情高涨、又有一定能力的组织者就会活动起来了。
可行性/初步破解
首先,发起者会找到一名核心的技术人员。来确认一下这款游戏汉化的可行性。
这名技术人员将是贯穿整个项目最最重要的人员之一,所有后续的工作,都会建立在这个人的工作成果上。我先表明我的一个观点:一款游戏汉化的实现与否,起关键决定性作用的是破解人员。而这位核心的破解人员,将确定整个游戏汉化的基调,可以说他控制了整个项目进展的顺利程度。
在当时的业内,一位技术过硬的破解中坚是极度稀缺的资源。他需要很强的反编译能力(找到解密的方法)、洞察能力(发现汉化文本、图片的储存位置)、编程能力(写各种工具)、沟通能力(制定、交代各种汉化中需要遵守的规则,比如文本长度限制、代码内容等)。
这些技术大神们,在汉化届里,可谓是明星级的存在。我有很多崇拜的破解大神,他们都是中国游戏汉化届的、也是电子游戏文化普及的功臣。
这位破解人员与组织发起者一起,对目标游戏进行分析:
1. 破解难度如何 2. 文本量多少 3. 所需的组织规模
首先核心破解人员会对游戏进行解密。早期的主机游戏,厂商之间都没有共通的加密标准,各自有各自的编程语言、编程习惯和加密方式。破解要寻找破解目标游戏的方式,将各种介质中的文件结构按照他想要的方式解压出来,才能找到需要汉化的内容。
成功解包之后,就能够寻找文本大致的所在位置了。通常来说,大部分游戏的主要内容文本都是存放在一起的,找到其中一个之后基本能够确定大部分文本的位置,这样就能看到整个游戏需要汉化的文本规模,供发起者判断接下来的工作量。
接下来破解人员还要寻找一个东西,它就是汉化中非常关键的因素:字库。
很多人对这个东西没有什么认识,而这个东西将影响整个项目的质量。
首先我来解释一下什么是字库:
字库的形式通常是一张图片和一个映射表(码表)。
——————————————————字库解释
——————————————————
众所周知,计算机软件是代码写成的。所以你在屏幕上看见的文本,计算机处理时,并不像人类一样是用语言能力组织出来的。而是通过一套映射方式,从一张排满了字符的图片里挑选要显示的字符,再按编程者制定的顺序排列,形成文本。
拿一段汉字文本打个比方。“我恢复正常了”这段文字,“我”对应的代码是#00,“恢”对应的代码是#01,以此类推。那么,游戏中需要显示这句对白是,计算机实际首先读取到的需要显示的内容是
“#00#01#02#03#04#05”。接着计算机将去一张码表里读取这个代码,比如#01代码映射的是图片中的第一行第一列(1-1):
计算机就会对这张图片里的1-1部分寻址,然后将得到的“部分图片”也就是“我”这个汉字图像,显示到屏幕上。同理其他的字符也是这么显示的。
游戏开发人员会根据游戏使用的文本,编排一个字库图,这张图里会包含这个游戏里用到的所有文字,接着设定码表,哪个代码字符代表显示这张图里的哪个部分,就可以正常显示游戏中的文本了。
那对于汉化者来说,字库带来的问题是什么呢?首先他们一般得到的字库图片是需要解码的,如下图:
乍一看根本不知道这是什么,需要解析这些像素的排列之后,重新排列,才能得到正确的字库如:
得到字库图之后,就完了吗?对于海外英化游戏的组织来说,可能就OK了。但是汉化不行,如果原文是英文的游戏,你会发现,字库里只会有a-z的大小写字母,以及一些常用的标点符号;如果原文是日文的游戏,早期一点的比如FC游戏GBA游戏,只会有五十音图和标点,后期一点的PS、SS游戏,会有大概100个-300个的汉字加上五十音图和标点。
问题在哪?问题在于这些语言可以用有限的字符来排列出他们所需的句子,而汉语除非使用拼音(早期日本游戏的文本显示就全是假名,类似使用拼音),不然所需的字符将是非常庞大的。
所以汉化人员需要对字库进行扩容,把众多的汉字加进去。这个工作具体是在主流程的导入步骤进行的。我们后面再说扩容面临的问题。
——————————————————字库解释完毕
————————————————
解包出来的东西,在重新打包成可运行的游戏文件当中也可能出现各种问题。为了测试汉化成果放入游戏后的运行情况,破解导出一小段文本,初步翻译(也可能用“测试这是测试测试这是!!&……¥%”这种文本去,总之就是替换掉原文就行)之后,制作一个暂定的扩容字库,然后重新打包到游戏里,运行一下看看实际结果。
除此之外,破解还得解析游戏用的图片格式,压缩方法等等……这个我不太了解就不详述了。
一切顺利的话,组织者们就可以确定这款游戏的汉化是可行的。
组织编成
确定完可行性和工作量,组织者们就要开始去拉人入伙啦!如果是万众期待的超大作,那跃跃欲试的人会非常之多,如何判断这些人的素质水平和思想觉悟,是组织者很重要的工作。
总之就会有各种进组的测试,如果有过汉化经验会加分很多。毕竟这是一个没有回报的工作,对其中的艰辛没有充分认识的话,能不能坚持下来是很难说的。
人员差不多到了组织者需要的程度之后,就会按照需求编排人员,按照职能、流程等等把团队组织起来。这基本就跟企业里的管理人员做的事情差不多,但是难度更高,因为企业里大家天天会来上班,有钱赚,为了晋升也会努力,而汉化组可不这样,你经常会面临找不到人,迟迟不交稿。会面临我失去兴趣了、家庭变故了、摔断腿了等等奇奇怪怪的弃坑缘由……
管理人员和进度,也是组织者在后续流程中最重要的工作之一。如果组织者还要实际担任后面流程中的某个步骤的话,那简直是地狱般的强度。所以,大部分汉化组会专门设立一些管理进度的催稿、联络、协调的人员。
人员编排完了,接下来就是分配工作了。破解组分别负责哪些部分的技术问题,翻译组和润色组谁负责哪部份的文本,校对组如何确保这些文本表意的正确性,同时哪些美工处理哪些图片,测试安排几轮又分别在什么时期,谁去对应外界的催更和伸手党,怎么处理可能存在的撞车 (就是别的汉化组也来汉化这款作品了)…………简直就是一个小企业了。
主流程
汉化组终于运转起来啦。
在组织编排步骤把工作分配好之后,就要按照图里的顺序开始工作了。
破解/程序
首当其冲的,还是破解和程序组的技术人员们。
在核心破解确定了技术上需要攻克的问题后,各自就开始负责自身的内容了。这些内容包括:寻找分离的文本、导出所有图片、编写各种工具、撰写各种技术文档、制作补丁程序等等。
虽然很多人玩汉化游戏看到的效果只是外文变成了中文,会认为翻译人员是其中的核心,但是我再提醒一下各位:破解和程序才是游戏汉化的核心。
所有其他人员的工作成果,都必须借由破解和程序组的工作来反应到游戏中去。他们是搭建整个大厦的人,而其他人为他们输送材料和后勤保障。
翻译
破解们把文本从游戏里导出来之后,通常是整个汉化组中人数最多的翻译们就要开始大展拳脚了。他们是整个汉化过程中工作量最大的群体,翻译部分也是所有流程中耗时最长的部分。
我参与汉化项目时,几乎主要的精力都是投入在翻译上,所以我对翻译这个部分是比较了解的。
翻译组的主要工作大致可以分为以下的部分:
我们通常会安排一个名词组来处理游戏中非常常见的专有名词,并制作一份名词表。名词表会划分为各种类别,比如人名、地名、怪物、技能…………
可不要小看名词的确定。游戏制作者们在给东西起名的时候,并不是随便拍脑袋决定的。根据游戏的类型、背景,通常会在名词里包含很多很多的信息,会对现实世界进行各种引用、影射。特别是日本游戏制作者,你通常会在名词阶段就考察出一大堆这些名词里想要表达的意义,是否能够理解其中的深意并转换出来,是名词组的一大难题。
我们来看一份名词表的截图:
在翻译名词的时候,认真负责的汉化人员不仅要研究其中的含义,有时候还要尊重一系列的翻译规则,比如在翻译拉丁文名字的时候,去参考一些专门的对应字表:
名词表是随着翻译的推进不停完善的,因为在整体的翻译业务开展前,无法完全掌握所有在游戏中可能出现的名词。只能先统括一个大概的名词表(这主要靠的是游玩过游戏的经验,不过大部分发起翻译的人员都是对自己想汉化的游戏了如指掌的),接着不停往里填充新的名词,负责名词的人员再去解决译名问题。
接下来是主体的内容翻译了,在进入内容翻译之前,我们要先明确一个要点:游戏文本的翻译非常非常特殊。
游戏文本的翻译,特别是民间汉化游戏文本的翻译,是完全不同于正常人理解的翻译的。当然,主体都是语言间的转换。但是在游戏汉化中,你会面临很多文章翻译、影视剧翻译不会遇到的问题:
首先我们来看一段真实的导出文本:
是否眼前一黑?
没错,游戏导出的文本中,如果不经过处理,普通人一眼看上去会非常难以解读。回想一下我在开头回答题主为何不能机翻的时候说过:
民间汉化导出的文本中会存在大量的指向代码、着色代码、排版代码,会把整个句子切分得七零八落
在这段文本中,你就可以看到大量这样的代码。在这里逐个分析的话,会非常花时间。简单一点来说,就这个游戏来说,每一段文字的开头基本都是人名代码。含有{color}的一般是染色代码,含有{select}{opt}的一般是选项代码,含有{03}这种数字的一般是延迟显示代码,etc。
对付这些代码,一般汉化组在开始前都会撰写翻译注意文档,来告知翻译会存在哪些代码,具体怎么处理,以及其它一些注意事项如文本长度限制等。当然,不是所有的翻译都能会完整的记住文档,并且正确处理。这时候还会用到汉化组的程序人员们专门编写的工具,我们后面介绍。
处理好代码,还有什么问题呢?对于翻译来说,最头疼的一个还是文本破碎。做翻译的都应该了解,翻译中很重要的技巧之一就是联系上下文理解内容,而游戏文本导出时,虽然也有前后两句有所联系的情况,但大多数时它们都是零散破碎的,通常是按照一些分类方式(比如地图的区域)堆放在一起。这就给翻译工作带来了极大的考验,我经常就会遇到翻译一句话的时候,反应过来它我与我20天前在另一块文本里说到的内容是联系在一起的。
除了代码、文本破碎之外,其实还有很多游戏汉化中存在的障碍和限制,包括但不限于文本字数限制、单行长度限制、可用字符限制、特殊符号限制…………………
为了对付这些恼人的问题,就要用到汉化组的程序人员们编写的各种好用的工具了,比如下面这款文本工具:
这样的文本管理工具,集合了文本排版、代码标注、文本编辑、文本对照、文本长度提示、快捷跨区块操作等等功能,可以大大加速文本翻译的效率。并且,从翻译到校对的所有文本流程都能在一个工具里完成,可以输出相同格式的文本内容,非常方便。
总之,游戏文本的翻译不像大部分人想象中的”翻译“,它是一项非常艰苦耗时的工作。
润色
润色通常会跟随翻译进行,也有翻译全部完成后统一润色的。主要视项目的规模,如果文本量巨大的游戏,全部等待翻译完成再启动润色的话,浪费的时间会很多。
润色的工作我想很多人都应该了解,就是将翻译输出的文本根据目标语言的表达方式进行修饰。因为语言间的语序、表达方式等差异,加上翻译人员高强度的工作量,要求翻译组的成员们在翻译的同时还能保持非常良好的遣词造句、语序通顺是很难实现的,所以需要润色工作人员们(通常拥有较好的表达能力、文学修养)将文本整理通顺,加以符合语言习惯的表达方式,实现游戏文本的高可读性。
润色的水平决定了最终成品能否更完整、准确体现游戏内容。优异的润色可以大大加强文本的表现力,读起来流畅通顺,避免玩家的理解偏差(有的低质量文本甚至会误导玩家)。
同时,润色还会承担部分审核文本正确性的工作,这里的正确性不是指表达方面的,而是翻译们输出的文本是否遵循了本项目上的限制。比如是否使用了正确的译名,是否存在字库里不允许的字符,文本长度有没有超过限制,是否改变了文本的段落结构等等。
校对
校对是文字流程的最终部分。通常来说,校对组会有若干个初校人员,少数精校人员,和最终的一个终校人员。
一般文本完成润色之后,分配到初校人员手中,来确认文本是否符合原文的表意,包括翻译上的错误和润色是否过润改变了原意。精校则是在初校完成后(有时还会和测试同时进行)再次的把关。而终校一般是在最后由同一个人来把控整个的用词、统一语言风格、查漏补缺。
其实在整个文字流程里,对校对的外语能力要求反而是更高的,所以招募的时候,外语水平比较好的部分人员会分配到校对组去。
校对比较考验耐心和注意力,很多隐藏的小毛病和小错误非常隐蔽。特别是碰到译文表达与原文表达有微妙区别的时候,更是纠结万分,译文也不算错,但是就是差点意思,改起来又无从下手(血泪史)。
美工
我对美工的工作了解得不多。我主要知道的一个就是游戏中部分文本是以图片形式存在的,那么如果要实现完全汉化,这部分的文本就需要以图片形式替换。美工从翻译那里得到翻译后,要将原图中的文字替换为中文,而且要保证显示效果与游戏原来的效果一致。这中间还会发生类似很多的图片压缩、调色盘、容量、分辨率等等问题。
另外,字库工作的一部分也需要美工的帮助。
最后,美工还要负责后期发布前的视觉宣传等材料的制作。
导入
文本和图片的翻译都完成之后,程序人员就要将这些变更过的游戏文件按照原结构放回游戏当中去。在这个步骤中,就会发生很多的技术问题。
最为重要的,就是字库的扩容问题。
在前面我们说过字库的相关背景,早期游戏中,日英文字库能够显示的字符十分有限,比较大的日文字库也就最多有600多个可用字符,而中文文本要使用的汉字数量会远远超过这个数量。所以破解和程序人员需要想办法对内置的字库进行扩容。
以前的主机游戏,游戏的ROM文件大小都是有限制的,同样字库文件的大小也会面临限制。同时,游戏在运行时,分配给字库使用的内存大小也是有限制的,所以如何扩充字库可使用的字符数量,又不会超过游戏ROM和内存的容量限制,是汉化组处理字库时的一大难题。
好在很多游戏在ROM中会存放一些空白文件或者没有使用的文件来填充容量,那么只要将这块区域中的数据去掉,并在此放入扩容的字库即可。
扩容的具体操作由于我不是专业的人员,不是十分了解。如果对字库扩容有兴趣的人可以去搜索具体的游戏汉化破解教程,或者可以在评论里留言,我也许可以请到一些原先游戏汉化界的破解人员来详细讲讲这个部分。
测试
顾名思义,所有完成翻译、修改的文件重新打包为游戏数据之后,自然要通过测试来保证汉化后的游戏是可以正常游玩的。在这个过程中,会对整个汉化流程中,有过修改的环节进行再一次的确认。这个过程就像游戏开发商制作游戏的DEBUG流程一样,要确认的内容很多:
………………
测试通常会进行很多轮,每次要确认的目的也会有所不同。
测试中出现的问题需要破解人员的快速解决,然后重新投入测试。有时,终校的人员会同时兼任一部分测试的工作
发布
恭喜你,你的汉化项目完美的通过了最终的测试,所有要素正常运行,所有文本均完美汉化。终于到了发布的这一天了。
策划组织者加班加点写出一份汉化说明,程序人员彻夜制作补丁程序(当年为了避免法律问题,汉化组通常发布给游戏媒介打补丁的程序而不是已经打好补丁的游戏本身) ,美工精益求精地绘制一副发布用的海报……
发布流程是整个项目里最激动人心和最紧张忙碌的阶段,一些大型项目可能耗时几年时间,终于要交给期盼已久的玩家们了,所有人都非常期待(也非常疲惫)。
在我还参与汉化的年代,大部分的汉化组织是挂靠BBS的。那个时候基本没有非常独立的汉化团队,基本属于某个论坛挂靠的组织。这些汉化组织发布作品时会在该论坛的专门版块发布。
(很多早期的汉化组论坛本身已经不存在了,实在找不到发布贴了2333)
还有一部分的汉化组织是针对单个作品的,发起时成立,完成后解散。
而后来,大部分的汉化作品会选择发布在一些平台型网站上,比如以前的扑家。
总之,汉化组忙碌了很长一段时间,消耗了无数精力的作品终于发布了。发布这一刻的自豪感,大概就是对这项毫无回报的工作的最大期许吧。
后期
收集反馈、修正
对于最多不超过百人的汉化组来说,内部测试的能力肯定是有限的。所以当作品发布后,大量玩家投入游戏,难免会发现很多瑕疵之处。一般汉化组在发布汉化的同时,会开辟一块供玩家反馈意见的地方,同时汉化组会有人跟踪这些意见,整理目前出现的问题,提交到组内。
负责任的汉化组会不停对发现的问题进行修正,并持续迭代汉化补丁。
至此,一款游戏的汉化过程就完全结束了。整个项目从发起到结束,可能会经历数年时间,有许许多多的人会放弃离开,又有许多人会加入,所有的汉化者都凭着对电子游戏的热爱坚持着。我非常尊敬一直以来能够坚持奋斗在汉化第一线的各路大神们,更对早期开创出游戏汉化这一事业的先驱者们表示无比地佩服。
引用我心目中民间游戏汉化界无上杰作的《最终幻想IX汉化版》策划人虹之战士的一句话:
珍惜生命,远离汉化……
愿游戏本地化的路越走越宽,越行越远。
P.S. 以后有精力的话,再来更新一些当年汉化界的趣事——比如闻名天下的“塞式翻译法”。
以上。