По поводу всякого разного сканирования. По опыту самый лучший вариант - FineReader (сканирование 300 dpi). Распознавание текста получается почти идеально, в случае чего подправляется ручками. В среднем скорость выдачи результата ~30-40 сек на страницу. То есть пока сканер сканирует, проверяется/подправляется то, что сканировалось. Пока сканер возвращает назад лампочку, переворачиваем страничку и опять запускаем на сканирование/распознавание. То есть как белка в колесе :-)

Потом этот отсканированный проект можно при желании перераспознавать (наибольшее время - распознавание текста внутри картинок и оформление табличек) и перепроверять.

Если не хочется готовить идеальный Word'овый вариант со 100% совпадением стилей, выравниванием и перевёрсткой на A4, то делается экспорт в PDF page-by-page. Именно в PDF, а не в Word, поскольку при экспорте в Word немного теряется форматирование объектов относительно самой страницы, и текстики/картинки могут поехать.

В результате из книги формата A5 на 100-150 стр. получается качественный PDF размером в районе 2-4 Mb (зависит от количества картинок). Картинки ну очень рекомендуется сохранять в 300 dpi; ну не стоит из-за лишних 500k терять качество.