Skip to content

Instantly share code, notes, and snippets.

@moluapple
Last active December 10, 2015 01:48
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save moluapple/4362781 to your computer and use it in GitHub Desktop.
Save moluapple/4362781 to your computer and use it in GitHub Desktop.
纸质书籍电子版制作一般流程

##纸质书籍电子版制作一般流程

  1. 扫描
  2. OCR文本识别
  3. 人工校对
  4. 排版(版面大致/精确还原)
  5. 二次校对 ……

我们一般从步骤2开始。

OCR文本识别,使用软件 ABBYY FineReader 将 PDF 文档转换成可编辑的电子文本。视文档页数而定,一般几十分钟即可完成。然后导出TXT格式纯文本供校对。

人工校对,流程视各人习惯及条件而定。一般同时打开PDF及TXT文档,屏幕左右对分,目视校对。以下几点建议供参考:

  • 为缓解视力疲劳,可为PDF文档添加一个深色水印背景。图示:
  • 使用查找替换功能较为强大的文本编辑软件,推荐SublimeText 2,下载地址:http://www.sublimetext.com/2 。因为很多错误可能会经常出现,所以最好在一开始发现的时候,就使用查找替换来更正,而不是一个一个更正。(SublimeText 2支持正则表达式,如果熟悉正则表达式的会将事半功倍。试举一例:“南斯拉夫”,识别出的错误文本可能是“东斯拉夫”、“西斯拉夫”等各种情况,使用正则替换的话,可以查找“.斯拉夫”,替换为“南斯拉夫”即可一次完成多种错误更正。)
  • 校对时顺便做出格式标记,方便后期排版。 标记格式:
  • 引文:引文用花括号括起来,例如{这是一段引文}
  • 大标/小标:文章内部大小标按级别,在段落开头加号(最高级别,次级**,再次级***,依次类推)
  • 篇/章/节等标题一般含有“篇/章/节”字样,可以方便查找到的无需特殊标记。
  • 注释:注释前加“注:”字样,紧跟放置于该注释所属段落的后面
  • 图表拟由排版者处理,其他人可以直接略过

排版,使用 Adobe Indesign 完成。

二次校对,如有需要的话,将已排版好的文档再分发给原校对者,直接在PDF上以批注形式完成。反馈给排版者修订。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment