Аналіз методів класифікації та агрегації текстових даних з зображення

Автор(и)

  • Богдан Попович Національний технічний університет «Харківський політехнічний інститут» Автор https://orcid.org/0009-0009-6802-1549
  • Ганна Заволодько Національний технічний університет «Харківський політехнічний інститут» Автор https://orcid.org/0000-0003-0000-8910

DOI:

https://doi.org/10.31861/sisiot2024.1.01008

Ключові слова:

розпізнавання тексту, машинне навчання, автоматизація обробки даних, багатомовні тексти, порівняльний аналіз

Анотація

У статті досліджуються сучасні методи розпізнавання тексту з зображень, зокрема порівнюються оптичне розпізнавання символів (ОРС) та інтелектуальне розпізнавання символів (ІРС). Розглянуто технології машинного навчання, включаючи згорткові нейронні мережі (ЗНМ) та рекурентні нейронні мережі (РНМ), які використовуються для підвищення точності та ефективності обробки рукописних і друкованих текстів. Вивчено переваги та обмеження існуючих рішень для формування цифрових документів з зображень, що містять різні стилі почерку і текст на зображеннях низької якості. Зокрема, ІРС демонструє високу адаптивність до змінних умов, що робить його ефективнішим у порівнянні з традиційними методами ОРС. Значна увага приділена здатності ICR обробляти багатомовні тексти, що розширює можливості її використання у різних сферах діяльності. У статті також аналізуються основні виклики, пов'язані з обробкою рукописного тексту різних стилів, а також необхідність покращення швидкості розпізнавання. Представлені результати свідчать про високий потенціал використання ЗНМ та РНМ у задачах ОРС, а також про перспективність гібридних моделей, що поєднують переваги обох підходів для досягнення дуже високої точності розпізнавання. Особливо важливим є застосування цих технологій у таких галузях, як цифрова обробка рукописних документів, автоматизація поштових послуг та розширення інструментів доступності. Ці висновки підкреслюють важливість подальших досліджень та розвитку технологій розпізнавання тексту для покращення ефективності обробки даних та інтеграції рукописних текстів у сучасні інформаційні системи. Дослідження показує, що технології машинного навчання та глибокого навчання можуть значно покращити точність розпізнавання тексту, зменшуючи необхідність людського втручання та прискорюючи процес обробки даних. У статті також розглядаються практичні аспекти впровадження цих технологій, зокрема, необхідність великих обчислювальних ресурсів для навчання моделей та забезпечення надійної роботи систем у різних умовах. Це дослідження є важливим внеском у розвиток технологій цифрової обробки тексту, що мають широкі перспективи застосування у різних галузях, включаючи науку, медицину, освіту та бізнес. Використання сучасних методів розпізнавання тексту дозволить значно підвищити ефективність обробки інформації та сприяти розвитку інноваційних рішень для роботи з великими обсягами даних.

Завантажити

Дані для завантаження поки недоступні.

Біографії авторів

  • Богдан Попович, Національний технічний університет «Харківський політехнічний інститут»

    Богдан, 23 роки, навчався та отримав ступінь бакалавра та магістра в НТУ «ХПІ». У 2023 році під час роботи над магістерською дисертацією досліджував використання штучного інтелекту у веб-додатках. У 2024 році приєднався до команди ReMnemo, перспективного стартапу, який успішно пройшов акселераційну програму. У ReMnemo займається застосуванням штучного інтелекту в різних проектах.

  • Ганна Заволодько, Національний технічний університет «Харківський політехнічний інститут»

    Ганна, 46 років, кандидат технічних наук, доцент НТУ «ХПІ», старший член IEEE; генеральний директор і співзасновник ReMnemo.

Посилання

Wikipedia, “Intelligent Word Recognition.” [Online]. Available: https://en.wikipedia.org/wiki/Intelligent_word_recognition. [Accessed: Jul. 29, 2024].

ABTO Software, “Intelligent Character Recognition (ICR) of Handwritten Text.” [Online]. Available: https://www.abtosoftware.com/intelligent-character-recognition-icr. [Accessed: Jul. 29, 2024].

Shufti Pro, “Demand for OCR Technology Increasing in ID Verification.” [Online]. Available: https://shuftipro.com/demand-for-ocr-technology-increasing-in-id-verification. [Accessed: Jul. 29, 2024].

Label Your Data, “What is ICR Technology.” [Online]. Available: https://www.labelyourdata.com/what-is-icr-technology. [Accessed: Jul. 29, 2024].

AWS, “What is OCR.” [Online]. Available: https://aws.amazon.com/what-is/ocr/. [Accessed: Jul. 29, 2024].

Shufti Pro, “Intelligent Character Recognition (ICR) Software: One Step Ahead of OCR.” [Online]. Available: https://shuftipro.com/intelligent-character-recognition-software. [Accessed: Jul. 29, 2024].

M. M. Nayak and D. Vaidehi, “Handwritten Character Recognition Using CNN,” International Journal of Computer Engineering and Technology (IJCET), vol. 15, no. 3, pp. 219-229, 2024.

S. L. Wasankar, H. Mahajan, D. Deshmukh, and H. Munot, “Self Intelligence with Text Recognization,” Government College of Engineering, Amravati, India, 2024.

Techopedia, “How Intelligent Character Recognition (ICR) is Overcoming OCR Limitations in Document Processing.” [Online]. Available: https://www.techopedia.com/how-intelligent-character-recognition-icr-is-overcoming-ocr-limitations-in-document-processing. [Accessed: Jul. 29, 2024].

F. M. Shiri, T. Perumal, N. Mustapha, and R. Mohamed, “A Comprehensive Overview and Comparative Analysis on Deep Learning Models: CNN, RNN, LSTM, GRU,” pp. 9-11, 2023.

R. Smith, “An Overview of the Tesseract OCR Engine,” in Ninth International Conference on Document Analysis and Recognition (ICDAR), pp. 629-633, 2007.

S. Malakar and P. Roy, “A Study on the Impact of Intelligent Character Recognition (ICR) on Digitizing Handwritten Documents,” International Journal of Advanced Research in Computer Science and Software Engineering, pp. 15-20, 2018.

Завантаження


Переглядів анотації: 0

Опубліковано

2024-08-30

Номер

Розділ

Статті

Як цитувати

[1]
Б. Попович and Г. Заволодько, “Аналіз методів класифікації та агрегації текстових даних з зображення”, SISIOT, vol. 2, no. 1, p. 01008, Aug. 2024, doi: 10.31861/sisiot2024.1.01008.

Схожі статті

Ви також можете розпочати розширений пошук схожих статей для цієї статті.

Статті цього автора (цих авторів), які найбільше читають