Восстановление последовательности записи в сканированных рукописных текстах

 pdf (320K)

Рассматривается задача распознавания рукописных текстов с растровых изображений. Описывается метод восстановления последовательности записи рукописного текста, который позволит свести задачу offline-распознавания к задаче online-распознавания. Метод заключается в поиске эйлерова пути с минимальным весом в графе скелета рукописных символов. В качестве весов рассматриваются некоторые числовые характеристики, отражающие сложность перехода из одного ребра в другое через общую вершину. Для этого строится таблица всевозможных комбинаций пар. При отсутствии в исходном графе эйлерова пути выполняется поиск пути с минимальным числом разрывов. Для разбиения ребер на пары и вычисления весов в вершинах нечетной кратности вводится понятие виртуального ребра, переход по которому означает образование разрыва в пути. Рассматривается алгоритм поиска пути в скелете символа, основанный на алгоритме Флери поиска эйлерова пути.

Ключевые слова: граф скелета рукописного символа, путь в скелете, виртуальное ребро
Цитата: Вестник Удмуртского университета. Математика. Механика. Компьютерные науки, 2018, т. 28, вып. 4, с. 595-610
DOI: 10.20537/vm180411

Recovering the recording sequence in scanned handwritten texts

The article deals with the problem of recognizing handwritten texts from raster images. A method to recover the sequence of records in a handwritten text is described, that will reduce the task of offline-recognition to the task of online-recognition. The method is based on finding the Eulerian path with the minimum weight in the handwritten symbol skeleton graph. Some numerical characteristics are considered as weights, they show the complexity of the transition from one edge to another through a common vertex. A table of all possible combinations of pairs is constructed for this purpose. If there isn't Eulerian path in the original graph, the path is searched with the minimum number of breaks. The definition of a virtual edge is introduced, the transition on it is the formation of a gap in the path. It is necessary to split edges into pairs and calculate the weights at the vertices of odd multiplicity. The pathfinding algorithm in the skeleton of a symbol is considered, it is based on the Fleury's algorithm of searching Eulerian path.

Keywords: graph of a handwritten symbol skeleton, path in the skeleton, virtual edge
Citation in English: Vestnik Udmurtskogo Universiteta. Matematika. Mekhanika. Komp'yuternye Nauki, 2018, vol. 28, issue 4, pp. 595-610

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref