日漫机翻经验谈(1)之总述
接触日漫机翻快两个月了,也积累了一些经验,在此与诸君分享,希望有所帮助。
归档目录
难点
单论日漫或许稍显空泛,我们可以与日本轻小说和 Galgame 的机翻进行对比。
日本轻小说基本是纯文本,难度最低,基本上配合 neavo/LinguaGacha 和强大的 LLM 就能达到比较好的翻译效果。
Galgame 除了纯文本之外,属解包与封装等需要一些计算机技术的操作最为麻烦。好在 Galgame 游戏引擎比较固定,望闻问切其引擎之后,便可对症下药。
而日漫本质上还是属于图片翻译,比轻小说的纯文本还多出空间信息,这也是机翻的难点所在。此外,还需要嵌字与修图。
如果只是单纯地外挂式字幕,那么漫画机翻其实也不难,因为现在的 LLM, 比如 gemini 2.5 pro 的视觉能力足够强,能准确的识别出日漫气泡中的对话,以及其外的拟声词等文字。进一步的,还能对每个文字块以人类的阅读顺序进行排序。
比如对于下面这张漫画。
之总述-1753679777101.jpeg)
gemini 2.5 pro 的翻译结果如下。
| 序号 (左) | 类型 (左) | 原文 (左) | 译文 (左) | 备注 (左) | 序号 (右) | 类型 (右) | 原文 (右) | 译文 (右) | 备注 (右) |
|---|---|---|---|---|---|---|---|---|---|
| 1.1 | 对话框 | そして エリザまで メイドになりたいと 言い出したのだ | 然后,就连伊莉莎也说想当女仆了。 | 1.2 | 对话框 | 最近は 情勢も安定しており 皇帝としての仕事にも 余裕があるという その余暇を使って 民の暮らしを 体験したい ということだ | 说是最近局势稳定,作为皇帝的工作也有了余裕,所以想利用这份闲暇来体验一下平民的生活。 | 此处是在转述伊莉莎的理由。 | |
| 1.3 | 对话框 | なんというか… エリザらしい | 该怎么说呢… 真有伊莉莎的风格。 | 1.4 | 音效 (SFX) | ガタ | 嘎啦 (ガタ) | 物体晃动的声音,可能是马车或火车。 | |
| 1.5 | 音效 (SFX) | ガタ | 嘎啦 (ガタ) | 同上。 | 2.1 | 对话框 | アメリア エリザは うまくやってる? | 亚美莉亚,伊莉莎她干得怎么样? | |
| 2.2 | 对话框 | はい それはもう | 是的,那当然了。 | 2.3 | 对话框 | この春から アメリアは メイド長になった 私つきのメイドを 長にすることで 徐々に父上から家督を 譲り受ける準備をしている | 从今年春天起,亚美莉亚就成了女仆长。通过让我专属的女仆担任长官,我正在为日后从父亲大人那里继承家业做着逐步的准备。 | ||
| 3.1 | 对话框 | エリザ様はひとたび メイド服をまとえば 完全にメイドとして 振る舞われて… ご身分をおくびにも 出しません | 伊莉莎大人一旦穿上女仆装,就会完全像个女仆一样行事… 丝毫不会表露出自己的身份。 | 「おくびにも出さない」是惯用语,指“丝毫不表露”。 | 3.2 | 对话框 | さすがは お姉さまです 知った時は びっくりしました | 真不愧是姐姐大人。我刚知道的时候也吓了一跳呢。 | |
| 3.3 | 音效 (SFX) | ガタ | 嘎啦 (ガタ) | 物体晃动声。 | 4.1 | 思考框 | 元からうちにいた メイドたちは エリザが皇帝だと 知っているが 貴族の令嬢たちには 正体を明かすわけには いかない | 原本就在我家的女仆们虽然知道伊莉莎是皇帝,但我们不能向那些贵族千金们揭露她的真实身份。 | 这是内心独白。 |
| 4.2 | 思考框 | どこから 噂が広まるか わからないからだ | 因为不知道谣言会从哪里传开。 | 4.3 | 思考框 | 何事も 起きなければ いいけど… | 要是什么事都没发生就好了… | 语气中带有担忧。 |
效果还是不错的。
但是这样阅读很累... 并不舒服... 我们希望的是完成嵌字与修图之后的漫画,而不仅仅是外挂的字幕。
现状及效果展示
我只能以两个月的见闻随便谈谈日漫机翻的现状。
付费服务我知之甚少,但对于免费方法,已经基本能达到流畅阅读的效果。当然与专业汉化组仍有很大差距,但是自用基本没问题。
比如对于场景并不复杂的漫画。
之总述-1753680270998.jpeg)
基本能“完美”翻译。
之总述-1753680285546.jpeg)
如果场景稍微复杂一些,涉及旋转的文字气泡框。
之总述-1753680434732.jpg)
也有不错的效果。
之总述-1753680413826.jpg)
对于振假名。
之总述-1753680499146.jpg)
基本能识别并去除,不会造成混乱。
之总述-1753680512122.jpg)
基本流程
检测
简单来说是检测哪里有字,当然有些检测模型会刻意忽略难以 OCR 的拟声词。
下面这些蓝色框就是检测的结果。
之总述-1753681274713.png)
OCR
在检测之后,自然需要把有字的地方“看出”有什么字。
下面是 OCR 的结果。
之总述-1753681411951.png)
翻译
交给 LLM 翻译。
下面是翻译的结果。
之总述-1753681518215.png)
可以看到左边原文与译文重合了,这时候就需要图像修复了。
修复
相当于修图,包括但不限于擦除原文。
效果如下,原文被擦除了。
之总述-1753681626110.png)
其它步骤
除了以上列举的四步之外,还可以有校对、取色等更为细致的步骤。但这四个步骤是基础,也是接下来介绍的翻译工具所共用的流程。
翻译工具
主要有五个翻译工具,四个免费,一个付费。
免费的:
- zyddnys/manga-image-translator
- dmMaze/BallonsTranslator
- MashiroSaber03/Saber-Translator
- hgmzhn/manga-translator-ui
付费的:
根据主观判断做了一张表,大家可以根据需求选择适合的翻译器。
| Saber-Translator | manga-image-translator | BallonsTranslator | ImageTrans | manga-translator-ui | |
|---|---|---|---|---|---|
| 大批量翻译 | 0 | 3 | 3 | 2 | 3 |
| 导出原文 | 1 | 0.5 | 1 | 3 | 3 |
| 导入译文 | 1 | 0 | 1 | 3 | 3 |
| 模型选择丰富度 | 1 | 3 | 2 | 3 | 2 |
| 命令行支持 | 0 | 3 | 1 | 1 | 3 |
| AI OCR | 2 | 0.5 | 1 | 2 | 2 |
| AI 集成度 | 3 | 1 | 2 | 2 | 2 |
| 易用程度 | 3 | 1 | 2 | 1 | 3 |
| 自定义程度 | 1 | 3 | 2 | 5 | 3 |
| UI 界面 | 1 | 0.5 | 2 | 2 | 2 |
| 插件管理与使用 | 1 | 0 | 0 | 2 | 0 |
注:0 表示无此功能。数字越大,说明功能支持越佳。
以上五个工具,择其一即可,个人最为推荐 manga-translator-ui.
还有一些辅助的工具,后面会具体谈到。
