ОБРАБОТКА ИЗОБРАЖЕНИЙ ТОВАРНЫХ ЧЕКОВ ДЛЯ ВЫДЕЛЕНИЯ И РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ
https://doi.org/10.21822/2073-6185-2019-46-4-113-122
Аннотация
Цель. В данной статье рассматривается приложение, позволяющее осуществить обработку изображений товарных чеков для последующего извлечения текстовой информации с помощью Tesseract OCR Engine. Такое приложение полезно для ведения семейного бюджета или при проведении бухгалтерского учета в небольших компаниях. Основная проблема распознавания чеков – низкое качество краски и бумаги для печати, из-за чего она легко мнется и рвется, а напечатанные буквы быстро выцветают.
Метод. Исследование основано на ряде алгоритмов, основанных на методах математической морфологии операции размыкания, замыкания и морфологического градиента, преобразования изображений, которые позволяют существенно улучшить итоговое распознавание символов системой Tesseract.
Результат. Для решения этой проблемы был предложен специальный алгоритм нормализации изображения, включающий в себя нахождение чека на изображении, обработку полученного участка изображения, удаление дефектов съемки и дефектов носителя и точечную обработку для восстановления символов. Разработанное приложение позволяет значительно повысить точность распознавания текстовой информации при использовании Tesseract OCR.
Вывод. Разработанная система распознает знаки с достаточно высокой точностью, и показывает результат выше, чем при распознавании оригинальным методом Tesseract, однако все же уступает точности распознавания ABBY FineReader. Также были предложены методы, предположительно позволяющие улучшить разработанный алгоритм.
Об авторах
А. С. НаздрюхинРоссия
студент,
656038, г. Барнаул, пр. Ленина, 46
И. Н. Храмцов
Россия
студент,
656038, г. Барнаул, пр. Ленина, 46
А. Н. Тушев
Россия
кандидат технических наук, доцент кафедры информатики, вычислительной техники и информационной безопасности,
656038, г. Барнаул, пр. Ленина, 46
Список литературы
1. Главная страница ABBYY FineReader, https://www.abbyy.com/en-us/finereader/
2. Главная страница Tesseract Open Source OCR Engine, https://github.com/tesseract-ocr/tesseract
3. Главная страница OpenCV Homepage, https://opencv.org/ 4. Gonzalez, R., Woods, R.: Digital Image Processing, 4th edn. – Pearson, New York, 2018.
4. Bradley, D., Roth, G. Adaptive Thresholding using the Integral Image // J. Graphics Tools. – 2007. - №12. рр.13- 21.
5. Suzuki, S., Keiichi A. Be. Topological structural analysis of digitized binary images by border following // Computer Vision, Graphics, and Image Processing. – 1935. - №30(1). - p.32–46 .
6. Sklansky, J.: Finding the Convex Hull of a Simple Polygon. Pattern Recognition Letters 1(2), 79-83 (1982).
7. Sencar, H.T., Memon, N. Digital image forensics: There is more to a picture than meets the eye. Springer, New York (2013).
8. Chambolle, A., Caselles, V., Novaga, M., Cremers, D., Pock, T. An introduction to Total Variation for Image Analysis 9 (2010).
9. Ma, Z. & Wen, J. Single-scale Retinex sea fog removal algorithm fused the edge information // Jisuanji Fuzhu Sheji Yu Tuxingxue Xuebao/Journal of Computer-Aided Design and Computer Graphics 27. 217-225 (2015).
10. Li, B., Xu, D., Lee, M., Feng, S. A Multi-Scale Adaptive Grey World Algorithm // IEICE Transactions 90-D, 1121-1124 (2007).
11. Babakhani, R., Zarei, P. Automatic gamma correction based on average of brightness // Advances in Computer Science: an International Journal 4(6), 156-159 (2015).
12. Rahman, Sh., Rahman, Md. Mostafijur, Abdullah-Al-Wadud, M., Al-Quaderi, Golam Dastegir, Shoyaib, M. An adaptive gamma correction for image enhancement // EURASIP Journal on Image and Video Processing 35, (2016).
13. Haralick, R., Shapiro, L. Computer and Robot Vision, 1st edn, Addison-Wesley Publishing Company, Boston (1992).
14. Marr, D., Hildreth, E. Theory of Edge Detection. Proceedings of the Royal Society of London B 207, 187- 217 (1980)
15. Пелевин Е.Е., Балясный С.В. Использование метода Adaptive Threshold в системе технического зрения // Juvenis scientia. 2017. №1. С. 4-7.
16. A.Rosebrock, Practical Python and OpenCV, 3rd edn. PyImageSearch.com (2016).
17. Tomasi, C., Manduchi, R. Bilateral filtering for gray and color images // Sixth International Conference on Computer Vision, 839-846 (1998).
18. Peter Norvig’s cite: How to write a spelling corrector, https://norvig.com/spell-correct.html, last accessed 2019/11/30.
19. Liu, X., Cheng, K., Luo, Y., Duh, K., & Matsumoto, Y. A hybrid Chinese spelling correction using language model and statistical machine translation with reranking // In Proceedings of the Seventh SIGHAN Workshop on Chinese Language Processing, 54-58 (2013).
20. Popov, V., Kudinov, M., Piontkovskaya, I., Vytovtov, P., Nevidomsky, A. Differentially Private Distributed Learning for Language Modeling Tasks (2017). arXiv, https://arxiv.org/abs/1712.07473
Рецензия
Для цитирования:
Наздрюхин А.С., Храмцов И.Н., Тушев А.Н. ОБРАБОТКА ИЗОБРАЖЕНИЙ ТОВАРНЫХ ЧЕКОВ ДЛЯ ВЫДЕЛЕНИЯ И РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ. Вестник Дагестанского государственного технического университета. Технические науки. 2019;46(4):113-122. https://doi.org/10.21822/2073-6185-2019-46-4-113-122
For citation:
Nazdryukhin A.S., Khramtsov I.N., Tushev A.N. PROCESSING IMAGES OF SALES RECEIPTS FOR ISOLATING AND RECOGNISING TEXT INFORMATION. Herald of Dagestan State Technical University. Technical Sciences. 2019;46(4):113-122. (In Russ.) https://doi.org/10.21822/2073-6185-2019-46-4-113-122