##纸质书籍电子版制作一般流程
- 扫描
- OCR文本识别
- 人工校对
- 排版(版面大致/精确还原)
- 二次校对 ……
我们一般从步骤2开始。
OCR文本识别,使用软件 ABBYY FineReader 将 PDF 文档转换成可编辑的电子文本。视文档页数而定,一般几十分钟即可完成。然后导出TXT格式纯文本供校对。
人工校对,流程视各人习惯及条件而定。一般同时打开PDF及TXT文档,屏幕左右对分,目视校对。以下几点建议供参考:
- 为缓解视力疲劳,可为PDF文档添加一个深色水印背景。图示:
- 使用查找替换功能较为强大的文本编辑软件,推荐SublimeText 2,下载地址:http://www.sublimetext.com/2 。因为很多错误可能会经常出现,所以最好在一开始发现的时候,就使用查找替换来更正,而不是一个一个更正。(SublimeText 2支持正则表达式,如果熟悉正则表达式的会将事半功倍。试举一例:“南斯拉夫”,识别出的错误文本可能是“东斯拉夫”、“西斯拉夫”等各种情况,使用正则替换的话,可以查找“.斯拉夫”,替换为“南斯拉夫”即可一次完成多种错误更正。)
- 校对时顺便做出格式标记,方便后期排版。 标记格式:
- 引文:引文用花括号括起来,例如{这是一段引文}
- 大标/小标:文章内部大小标按级别,在段落开头加号(最高级别,次级**,再次级***,依次类推)
- 篇/章/节等标题一般含有“篇/章/节”字样,可以方便查找到的无需特殊标记。
- 注释:注释前加“注:”字样,紧跟放置于该注释所属段落的后面
- 图表拟由排版者处理,其他人可以直接略过
排版,使用 Adobe Indesign 完成。
二次校对,如有需要的话,将已排版好的文档再分发给原校对者,直接在PDF上以批注形式完成。反馈给排版者修订。