Среднестатистический офисный сканер не может похвастаться ни качеством изображения, ни скоростью. Работникам большинства небольших офисов приходится иметь дело с планшетным сканером, являющимся частью принтера. Хороший сканер стоит недешево. И если вы не планируете пользоваться им постоянно, то покупать его смысла нет. Если вы не удовлетворены качеством картинки, иногда проще решить проблему хорошим смартфоном.
Большинство современных телефонов среднего и верхнего ценовых сегментов оснащены отличными камерами, прекрасно справляющимися с ролью сканера. Тем не менее, если вам нужно отсканировать изображение с текстовой информацией, которую затем нужно будет распознать с помощью приложения OCR, вам может понадобиться улучшение качества отсканированного изображения. Как это сделать? Ответ вы найдете в этой статье.
Microsoft Lens
Разработано множество хороших приложений по обработке отсканированных изображений. Как под iOS, так и под Android. Однако если вам нужно бесплатное приложение, работающее со сканами документов, обратите внимание на Microsoft Office. Приложение MS Lens может определить края страницы и отделить эту страницу от поверхности, на которой она лежит. Результаты сканирования могут быть сохранены в графический файл или в PDF. Если вы сканируете с тонкого листа бумаги, помогите приложению, поместив черный лист бумаги под сканируемый документ.
То вам понадобится “продвинутое” приложение для работы с графикой. Можете воспользоваться Photoshop, GIMP или другим приложением, позволяющим изменять уровни цветов (color levels) изображений. В Photoshop нужная вам опция находится в Image>Adjustments>Levels (Изображение>Коррекция>Уровни). В GIMP — Color>Levels (Цвет>Уровни).
Но найти подходящий инструмент — это только начало работы. Вам придется поэкспериментировать с уровнями и, возможно, с насыщенностью, чтобы улучшить качество отсканированного изображения. Как правило, изменять уровни отдельных цветовых каналов не требуется, поэтому убедитесь, что выставлена цветовая модель RGB. Инструмент “Уровни” помогает регулировать яркость черно-белой картинки и менять градации серого в изображениях.
Поэкспериментируйте с ползунками уровней черного и белого цветов в Input Levels (“Входные уровни”). Заодно можете попытаться отрегулировать выходные уровни (output levels). Обратите внимание на фото 2. Изображение страницы имеет желтоватый оттенок. И чем старее книга, тем темнее будут ее страницы и, соответственно, сканы этих страниц. И тем хуже будет качество оптического распознавания текста программами OCR.
Но стоит проделать несколько несложных манипуляций с уровнями цветов, как мы получим изображение лучшего качества, с четким черным текстом на белой бумаге (фото 3). Обратите внимание, что средний тон изменился с 0 до 1.40. Чтобы сделать текст четче, попробуйте отрегулировать насыщенность и авто-контраст.
Описанные выше действия можно применить и к фотографиям, но времени на подгонку изображения уйдет намного больше, так как придется больше экспериментировать с уровнями каждого отдельного цветового канала.