Аналіз методів класифікації та агрегації текстових даних з зображення
DOI:
https://doi.org/10.31861/sisiot2024.1.01008Ключові слова:
розпізнавання тексту, машинне навчання, автоматизація обробки даних, багатомовні тексти, порівняльний аналізАнотація
У статті досліджуються сучасні методи розпізнавання тексту з зображень, зокрема порівнюються оптичне розпізнавання символів (ОРС) та інтелектуальне розпізнавання символів (ІРС). Розглянуто технології машинного навчання, включаючи згорткові нейронні мережі (ЗНМ) та рекурентні нейронні мережі (РНМ), які використовуються для підвищення точності та ефективності обробки рукописних і друкованих текстів. Вивчено переваги та обмеження існуючих рішень для формування цифрових документів з зображень, що містять різні стилі почерку і текст на зображеннях низької якості. Зокрема, ІРС демонструє високу адаптивність до змінних умов, що робить його ефективнішим у порівнянні з традиційними методами ОРС. Значна увага приділена здатності ICR обробляти багатомовні тексти, що розширює можливості її використання у різних сферах діяльності. У статті також аналізуються основні виклики, пов'язані з обробкою рукописного тексту різних стилів, а також необхідність покращення швидкості розпізнавання. Представлені результати свідчать про високий потенціал використання ЗНМ та РНМ у задачах ОРС, а також про перспективність гібридних моделей, що поєднують переваги обох підходів для досягнення дуже високої точності розпізнавання. Особливо важливим є застосування цих технологій у таких галузях, як цифрова обробка рукописних документів, автоматизація поштових послуг та розширення інструментів доступності. Ці висновки підкреслюють важливість подальших досліджень та розвитку технологій розпізнавання тексту для покращення ефективності обробки даних та інтеграції рукописних текстів у сучасні інформаційні системи. Дослідження показує, що технології машинного навчання та глибокого навчання можуть значно покращити точність розпізнавання тексту, зменшуючи необхідність людського втручання та прискорюючи процес обробки даних. У статті також розглядаються практичні аспекти впровадження цих технологій, зокрема, необхідність великих обчислювальних ресурсів для навчання моделей та забезпечення надійної роботи систем у різних умовах. Це дослідження є важливим внеском у розвиток технологій цифрової обробки тексту, що мають широкі перспективи застосування у різних галузях, включаючи науку, медицину, освіту та бізнес. Використання сучасних методів розпізнавання тексту дозволить значно підвищити ефективність обробки інформації та сприяти розвитку інноваційних рішень для роботи з великими обсягами даних.
Завантажити
Посилання
Wikipedia, “Intelligent Word Recognition.” [Online]. Available: https://en.wikipedia.org/wiki/Intelligent_word_recognition. [Accessed: Jul. 29, 2024].
ABTO Software, “Intelligent Character Recognition (ICR) of Handwritten Text.” [Online]. Available: https://www.abtosoftware.com/intelligent-character-recognition-icr. [Accessed: Jul. 29, 2024].
Shufti Pro, “Demand for OCR Technology Increasing in ID Verification.” [Online]. Available: https://shuftipro.com/demand-for-ocr-technology-increasing-in-id-verification. [Accessed: Jul. 29, 2024].
Label Your Data, “What is ICR Technology.” [Online]. Available: https://www.labelyourdata.com/what-is-icr-technology. [Accessed: Jul. 29, 2024].
AWS, “What is OCR.” [Online]. Available: https://aws.amazon.com/what-is/ocr/. [Accessed: Jul. 29, 2024].
Shufti Pro, “Intelligent Character Recognition (ICR) Software: One Step Ahead of OCR.” [Online]. Available: https://shuftipro.com/intelligent-character-recognition-software. [Accessed: Jul. 29, 2024].
M. M. Nayak and D. Vaidehi, “Handwritten Character Recognition Using CNN,” International Journal of Computer Engineering and Technology (IJCET), vol. 15, no. 3, pp. 219-229, 2024.
S. L. Wasankar, H. Mahajan, D. Deshmukh, and H. Munot, “Self Intelligence with Text Recognization,” Government College of Engineering, Amravati, India, 2024.
Techopedia, “How Intelligent Character Recognition (ICR) is Overcoming OCR Limitations in Document Processing.” [Online]. Available: https://www.techopedia.com/how-intelligent-character-recognition-icr-is-overcoming-ocr-limitations-in-document-processing. [Accessed: Jul. 29, 2024].
F. M. Shiri, T. Perumal, N. Mustapha, and R. Mohamed, “A Comprehensive Overview and Comparative Analysis on Deep Learning Models: CNN, RNN, LSTM, GRU,” pp. 9-11, 2023.
R. Smith, “An Overview of the Tesseract OCR Engine,” in Ninth International Conference on Document Analysis and Recognition (ICDAR), pp. 629-633, 2007.
S. Malakar and P. Roy, “A Study on the Impact of Intelligent Character Recognition (ICR) on Digitizing Handwritten Documents,” International Journal of Advanced Research in Computer Science and Software Engineering, pp. 15-20, 2018.
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2024 Безпека інфокомунікаційних систем та Інтернету речей
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.