cha

终于可以聊下 ChatGPT 偷袭出版业的一种姿势

  原标题:终于可以聊下 ChatGPT 偷袭出版业的一种姿势

  1)

  OpenAI 的 ChatGPT 持续爆火,基于其 API 开发的第三方应用工具也在井喷。

  最近看到网友 @liuzhida 开发的网页服务 「风声雨声」,就是「基于 GPT-3.5 的翻译服务」。

  它的网址是:https://fsys.app/

  功能简单说就是上传中文文档,然后返回给中英双语对照的版本。适合沉浸式英文阅读、严谨材料的学习。

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图1)

  2)

  自《增长黑客》出版以来,我始终聚焦前沿黑科技如何促进商业和个人的 10X 增长。

  关注我比较久的朋友,可能还记得,基于 AI 的双语翻译这件事,我两年前就折腾过。

  2020 下半年 - 2021 上半年那会儿,我热衷打磨自己的信息输入输出流程,还分享过我的个人知识管理(PKM)迭代经验 、信息筛选管道 ,做过 2 小时体量的油管直播 。

  我甚至自行开发了一套双语翻译系统,代号叫——「西塞罗(CICERO)」(古罗马著名政治家、雄辩家、哲人,死于话多)。

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图2)

  当时 GPT3 还在内测,并未向大众公开。所以我用的翻译技术,来自 DeepL。算是那时候全球最强劲的 AI 翻译服务。

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图3)

  翻译一整本书,通常需要较大的文字处理配额,而我又喜欢一次翻译好几本,所以起初花钱买了 DeepL Pro 版本,一个月几十美金,用上了付费的 API 接口。

  后来想了下大可不必,于是为了省预算, 我用 Selenium 做了一个很 tricky 的版本,可以绕过 API ,直接通过 Chrome 浏览器的无头模式(headless),从免费网页版获取对照翻译的前后文。

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图4)

  免费有免费的麻烦。比如:

  免费版有一次最多翻译 5000 字的限制

  某些特殊符号(包括 markdown 语法)在翻译时会丢失

  某些英文标点在翻译后会映射成错误的中文标点等

  傻傻地不启动翻译,需要在最后输入一个空格才开始工作

  为此我还慢慢调试打磨了一整套策略,才让对照翻译的任务变得丝滑。

  在陆续搞定这些问题后,有相当一阵子,我处在兴奋狂啃海外新书的状态中。

  我还专门写过文章,披露我的高效阅读技巧 、如何速读一本书的精华 (现在回看,不足为外人道)。

  3)

  独乐乐不如众乐乐。有这好玩的黑科技,就得炫耀给身边朋友们。

  于是私下里给真格的 yusen、flomo 的少楠 + lightory、刀法的 doris 都分享过一些新翻译的、尚未被国内进口的新书。

  像是《亚马逊逆向工作法》(Working Backwards)、《卡片笔记写作法》(how to take smart notes)、《The Story of Lululemom》(露露乐蒙传记,好像目前暂时仍未在国内出版?),小圈子内嗅觉敏锐又爱研究的朋友,都能第一时间读到。

  后来想想,能不能干脆借此聚集一波爱书之人,而且是有独立主见、不容易被社媒营销带货风潮忽悠、英文好擅啃外文的书友?想必是高知人群偏多。便萌生了免费提供对照翻译电子书,做一个社群的小尝试。

  当时给这个社群起名 —— 拼书书。

  灵感来源自然是拼多多。之所以有个「拼」,也是希望社群里的朋友不要纯白嫖,而是做点贡献,稍微缴纳点入群费,这钱我拿来去 Amazon 买新书。

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图5)

  4)

  这个社群小规模试跑了三个月,最终果断作罢。几个原因:

  1/ 起初大家是外文书荒,后来发现社群内一周能提供三五本新书,阅读消化的速度跟不上出新书的速度,于是对「追新书追热书」这事逐渐怯魅。

  2/ 显然,有版权问题等违规可能。尤其是当网友主动索要「我认知范围外某些领域的书」,例如涉及政治、经济格局、军事等,势必导致我极大的审核压力和风险。

  3/ 「读书是被高估的美德」。当个人基于兴趣驱动的阅读需求,杂糅到社群的党同伐异和炫耀攀比之风后,势必歪曲这件事的纯粹性,变得背离初衷。

  这事结束得悄无声息,群不久就沉寂了。

  交了入群费的网友也没有一个来追问后续,毕竟从收到的新书价格上看,早就超过了那点份子钱。

  5)

  我也曾考虑过,是否有其他规避风险的办法。

  比如:做个网页版,书籍由网友自行上传,而非我代购。—— 这固然能靠避风港原则部分解决版权争议,但并不能彻底摆脱违规的连带责任,得不偿失。

  比如:不提供全输翻译,只输出精华句段摘录 —— 但是否精华的鉴别权在我手,这是非常主观的判断,且某些非工具类书(例如有完整故事线的传记)不适合只摘录句段,否则阅读体验很不连贯。

  在全盘考虑之后,觉得还是不要把这事商业化了。哪怕是公益开源都不行, 很容易变成天神盗火,却玩火自焚。

  于是还是私下悄悄跟朋友们分享,以及友情推荐新书给出版社,或者帮他们做小规模市场调研/校对/推荐吧。

  像我近年作序的《纳瓦尔宝典》 、WeWork 传记《亿万负翁》 等,都是这样。

  6)

  这回 OpenAI 的 ChatGPT API,倒是让「将技术封装成用户所见即所得的产品」、「用摘要/缩句/改写来规避版权风险」变得更简单了。

  技术难度大副降低,意味着作恶成本更低。

  所以我的判断是,拼书书尝试过的商业化路径,更不能做。

  堂而皇之窃人劳动成果的事情,窗口期总是有限的,且监管只会更严。

  拿技术练手和小范围博短期名声可以,别玩过了。

  经历了过去几年的增长泡沫,我愈发关注「可能在什么地方暴毙」,而非「如何不顾一切地摧枯拉朽增长」。

  我公司的咨询和 FA 业务,也都是以此为基准来制定策略的(今年继续聚焦 Web3 和 AI,欢迎接洽合作:xdash@duck.com )。

  7)

  当然,出版行业也得警觉了,尤其是前几年倚靠外版书引入吃到甜头的。

  技术层面, AI 让普通人读到外版书的时间,从国内原本平均一两年,缩减到了半个小时(这里没有讨论合规等政策层面的问题)。

  出版社内的翻译、审校角色,也很容易被 AI 轻易取代 80%,甚至做得更好(比如让 AI 同时尝试 10 种文风来润色原文)。

  最近 K.K 一本畅想未来世界的新书也快上市了,我也给写了推荐语 —— 且坦率地告诉编辑,都是用 AI 生成的。

  ChatGPT 正从各个角度对出版业发起偷袭,而出版业这一次还剩什么底牌呢?

  8)

  终于可以聊下 ChatGPT 偷袭出版业的一种姿势(图6)

  与我微信交流

  责任编辑:


您可能还会对下面的文章感兴趣:

登录 注册 退出