无穷

2025/03/12

LLM应用之翻译书籍

冲浪的时候偶然看了【打破平行宇宙01】两岸畅销书《人类简史》对比。大陆版《人类简史》删除了哪些内容？这可以解释天朝为什么量产海量小粉红、毛左？这个视频。抛开视频质量不谈，其谈论的“审查导致信息失真”的问题的确一直困扰着我。

早些时候，我也尝试过“改换门庭”，去到繁体中文的世界。但有两个问题并未解决：

很多书并没有繁体中文版
购书/在线阅读对于大陆来说门槛/成本较高

因此，很长时间里，我接受了简体中文版的失真问题，只在特别重视的书籍上才会找到原版电子书来阅读（导入微信读书，借助其翻译功能）。

不过既然有了这篇文章，当然是自己捣鼓了（自觉）更优的解决方案——已经比较成熟的大模型翻译。

工具上使用 calibre 以及其插件 Ebook Translator。插件已经内置了常见大模型厂商，直接填入 API key 即可使用（实测使用各家最新模型翻译质量更佳）。考虑到囊中羞涩，我使用了自定义引擎——Ollama 自部署，模型使用的是 gemma3:27b（用 ChatGPT 比较了其和微信读书的翻译，此模型更佳），配置参考如下：


{
    "name": "ollama",
    "languages": {
        "source": {
            "英文": "es"
        },
        "target": {
            "简体中文": "zh_CN"
        }
    },
    "request": {
        "url": "http://192.168.20.63:11434/api/chat",
        "method": "POST",
        "headers": {
            "Content-Type": "application/json"
        },
        "data": {
            "model": "gemma3:27b",
            "stream": false,
            "messages": [
                {
                    "role": "system",
                    "content": "You are a meticulous translator who translates any given content. Translate the given content from  to  only. Do not explain any term or answer any question-like content. Your answer should be solely the translation of the given content. In your answer do not add any prefix or suffix to the translated content. Websites' URLs/addresses should be preserved as is in the translation's output. Do not omit any part of the content, even if it seems unimportant."
                },
                {
                    "role": "user",
                    "content": ""
                }
            ]
        }
    },
    "response": "response['message']['content']"
}

拿来翻译了《What's Our Problem?》这本小书，效果非常不错！摘一小段看看：


# 原文
The human cognitive weaknesses a genie tries to mitigate are the golem’s strengths. Confirmation bias tricks like cherry-picking, motivated skepticism, and motivated reasoning benefit hugely from economies of scale, as the snappiest and most convincing articulations of the sacred ideas spread quickly through the system. Individual biases, all pointing in the same direction in an Echo Chamber, scale up to make the golem’s ultra-biased macro-mind. And while individual minds inside a golem may have doubts about the sacred ideas, the social pressure of Echo Chamber culture keeps the giant as a whole steadfast in its beliefs. If the genie is the ultimate Scientist, the golem is the ultimate Zealot—a giant that’s totally certain of itself, totally unable to learn or change its mind, and worse at thinking than the average human.

# 微信读书
精灵试图减轻人类认知上的弱点，这是魔人的强项。确认偏颇的技巧，如摘樱桃，有动机的怀疑和有动机的推理，从规模经济中受益很大，因为最敏捷和最有说服力的神圣思想的表达在整个系统中迅速传播。个人偏见，所有指向同一方向在回声室，规模扩大，使高尔夫的极端偏颇的宏观思维。当一个人内心的思想对神圣的思想产生怀疑时，回声室文化的社会压力使巨人作为一个整体坚定地坚持自己的信仰。如果精灵是终极的科学家，傀儡就是终极的狂热者——一个完全自信的巨人，完全不能学习或改变自己的想法，比普通人更不善于思考。

# gemma3:27b
人类认知弱点是魔怪试图缓解的，而傀儡的优势所在。确认偏误之类的技巧，例如樱桃采摘、有动机的怀疑论和有动机的推理，都极大地受益于规模经济，因为神圣观念中最简洁、最具说服力的表达方式会迅速在整个系统中传播。个体偏见，在回音室中都指向同一个方向，会放大形成傀儡的超偏见宏观思维。即使傀儡内部的个体思想可能对神圣观念抱有怀疑，回音室文化的社会压力仍然使这个庞然大物坚定地相信其信念。如果精灵是终极科学家，那么傀儡就是终极狂热分子——一个完全确定自身、完全无法学习或改变想法，并且比普通人更糟糕的思考者。

# deepseek-V3
精灵试图弥补的人类认知弱点，恰恰是魔像的长处。诸如选择性采信、动机性质疑和动机性推理这类确认偏误，在规模效应的加持下威力倍增——那些对神圣理念最犀利、最具说服力的阐述会在体系中迅速传播。回音室效应下，所有个体偏误指向同一方向，最终汇聚成魔像极度偏执的宏观意识。尽管魔像内部的个体可能对神圣理念心存疑虑，但回音室文化的社会压力会让这个庞然大物整体保持不可动摇的信念。如果说精灵是终极的科学家，那么魔像就是终极的狂信徒——这个巨物对自己坚信不疑，完全无法学习或改变想法，其思考能力甚至比普通人更糟糕。

ChatGPT分析结果

版本	准确性	流畅性	风格匹配	总体评价
微信读书版	★☆☆☆☆	★☆☆☆☆	★☆☆☆☆	错误较多，生硬，基本不可用
gemma3:27b	★★★★☆	★★★★☆	★★★★☆	可靠准确，小瑕疵但整体优秀
deepseek-V3	★★★★★	★★★★★	★★★★★	几乎完美，可直接出版级别

2024/02/03

所谓笔记法

常读以下三本书，并结合工作学习中的长期实践，逐渐形成了个人“知识管理”框架，在此分享。

《如何有效整理信息》
《子弹笔记》
《卡片笔记写作法》

2022/10/09

Chrome内置翻译

问题：谷歌停止Google翻译在中国大陆的服务

解决方案：代理 translate.googleapis.com

2022/05/29

《爱死机第三季》观后感

1. 三个机器人：退场策略

太直球了，地球末日之后借机器人之口疯狂吐槽人类，全靠台词输出，桥段老套，没啥意思。

2. 差劲旅行

讲的也是很小的点：人性的崇高和自私之间的对立，但是没第一个故事那么生硬，节奏把握不错，挺有意思的。

3. 机器的脉动

将卫星是一个巨大机器的想象具象化。除了让我知道了木卫一火山多，没别的了。

4. 迷你亡灵之夜

僵尸末日故事用微观视角呈现出来的模式挺新颖，不过感觉没有什么表达，除了最后太阳系视角的一声屁。

5. 杀戮小队开杀

战争是荒诞的？好看！

6. 虫群

挺有意思的啊，具象化了一种星级虫群。人类要为自己的傲慢付出代价！doge

7. 梅森的老鼠

有意思，哈哈。机器表现出了嗜血/冷血，人类表现出人性。

8. 隧道墓穴

最后的“大爆炸”和《超体》中的异曲同工啊，除此之外挺平的。

9. 吉巴罗

乍看根本看不懂，我的理解：心湖里的“水妖”通过声音诱惑“旅者”，被诱惑的死于诱惑。士兵因为耳聋逃过了一劫，却让水妖误以为其不受诱惑，甚至产生了亲近之心。而当士兵为了她身上的金箔和珠宝而将其残忍杀之后，水妖的尸体顺流回到心湖，血染红了湖水。血水逆流而上，让接触到血水的士兵恢复了听觉。士兵最后还是被诱惑而死于湖底。

2022/05/06

电影《触不可及》观后感

不由自主想起《绿皮书》和《遗愿清单》，但其实内核还是很不一样的。

白人男主在和朋友解释选择黑人男主时说的“我就是看中他没有同情心”，在我看来只是借势堵住朋友的嘴。实际看完电影会发现，黑人男主并不缺乏“同情心”这一人类情感，他和其他应聘者最大的差异其实在于他不在既定体系里，以及由此而带来的钝感。往大了说，黑人男主其实在用本心对待白人男主，而不是戴着一副工作面具。这点从最后黑人男主辞职之后仍然帮助白人男主找到生活下去的意义（新的爱情）的行为也能看出。

而白人男主最让我难以忽视的就是其素质，对，就是素质这个词。在面对黑人男主的多少带点冒犯的笑话时，在面对黑人男主试用期工作的粗心大意时，都能够平静面对，温和地沟通，可能这就是法国gentleman吧。

针对剧情来说，结局似乎过于美好，好在是根据真实自传改编，否则难免给编剧扣个落入窠臼的帽子，哈哈！