Текущий выпуск Выпуск 1, 2025 Том 35
Результыты поиска по 'mathematical formula recognition':
Найдено статей: 4
  1. Работа посвящена использованию регулярных выражений при распознавании рукописных математических текстов. Основная проблема в распознавании рукописных математических формул состоит в том, что эти тексты, как правило, состоят из большого числа маленьких фрагментов, расположенных в соответствии с некоторыми строгими правилами. Несмотря на то, что формальное определение синтаксиса математических текстов может вовлекать бесконтекстные грамматики и даже более сложные конструкции, на практике часто для успешного распознавания достаточно определения математического языка на базе регулярных выражений. Поскольку некоторые конструкции в математических текстах могут встречаться чаще других, мы вводим понятие взвешенного регулярного выражения. Веса в нём определяют предпочтение одних конструкций перед другими. В работе вводится математический аппарат для использования таких выражений при распознавании. В частности, доказываются теоремы о пересечении взвешенных множеств, задаваемых такими регулярными выражениями. Даются некоторые оценки сложности работы алгоритмов использующих такие регулярные выражения для распознавания.

    The work is devoted to use of regular expressions at recognition of hand-written mathematic texts. The main problem in handwritten mathematical formula recognition is that these texts mainly consist of a large number of small fragments, arranged in accordance with some strict rules. Despite the fact that formal definition of syntax of mathematic texts can involve context-free grammars and even more complicated constructions, it frequently suffices definition of mathematical language on the base of regular expressions for successful recognition. Since some constructions can occur in mathematic texts frequently than other, we introduce the concept of the weighed regular expression. The weights determine preference of some constructions before other ones. In the work, mathematical tools for use of such expressions at recognition is introduced. Theorems about intersection of weighed sets defined by such regular expressions are proved. Some estimations are given to complexity of algorithms work using such regular expressions for recognition.

  2. В работе рассматривается задача распознавания рукописных математических формул. Описываются основные проблемы, возникающие при решении данной задачи. Описывается метод предупреждения и исправления ошибок распознавания, основанный на ручном управлении процессом распознавания. Приводятся математические модели предложенного метода, основанные на использовании элементов теории графов. Для этого вводится понятие регулярного дерева изображения формулы, которое позволяет хранить все варианты распознавания исходного изображения формулы в наиболее компактном виде и упрощать процесс группового редактирования множества вариантов распознавания, связанный с изменением характера связи между вершинами графа. Приводится пример удобного интерфейса программы для управления процессом распознавания и исправления ошибок, который не требует от пользователя знания формата представления математических формул.

    The article deals with the problem of recognition of handwritten mathematical formulae. It is reported about the main problems that arise in solving this task. Also it is specially noted the method for preventing and correcting recognition errors based on hand process of recognition. Much attention is given to mathematical models of the proposed method. They are based on graph theory. For this purpose, the definition of a regular tree for the image of formula is given it allows to keep all options for recognition of the original image of the formula in the most compact form and to simplify the process of editing a variety of options of the group recognition linked to the changing nature of the relationship between the vertices of graph. An example of user-friendly interface to manage the recognition and correction of errors is given that doesn't require user knowledge of the format of mathematical formulae.

  3. Рассматривается задача распознавания сканированных математических текстов с повторяющимися формулами либо формулами с общими фрагментами. Описывается метод сравнения результатов распознавания, позволяющий выделять идентичные элементы из множества вариантов распознавания. Метод основывается на вычислении расстояний Левенштейна между отдельными фрагментами с учетом дополнительных параметров. Предложенный метод отличается от обычного метода тем, что при наличии неопределенностей в процессе сравнения участвуют все возможные варианты распознавания, представленные в виде пары символ-вес. В случае нелинейных формул в сравнении участвуют дополнительные числовые параметры, задающие расположение отдельных символов на плоскости. Такое сравнение позволит сгруппировать формулы, а полученные данные будут полезны при принятии решений как человеком, так и программой. Использование данного метода упростит процесс ручного исправления ошибок, который будет основываться на динамическом управлении промежуточными результатами в процессе тесного человеко-машинного взаимодействия.

    The article deals with the problem of recognizing scanned mathematical texts with repeating formulas or formulas with same fragments. A method for comparing recognition results is described, which allows one to select similar elements from a variety of recognition options. The method is based on calculating the Levenshtein distances between individual fragments with additional parameters. The proposed method differs from the usual method in that, in the presence of uncertainties in comparison, all possible recognition options are used, presented as a symbol-weight pair. In the case of nonlinear formulas, numerical parameters that specify the location of individual symbols on the plane are also used in comparison. This comparison will allow you to group the formulas, and the data obtained will be useful in making decisions both by a user and by a program. Using this method will simplify the process of manual error correction, which will be based on the dynamic management of intermediate results in the process of close man-machine interaction.

  4. Работа посвящена использованию основных элементов теории графов в задаче распознавания математических формул. Вводятся понятия двухуровневых и двумерно ориентированных графов, которые позволяют описывать сложные изображения, состоящие из иерархии частей с особым взаимным расположением. Рассматривается специальное отображение, которое из математической формулы строит соответствующий двумерно ориентированный граф, называемый графом изображения формулы. Приводятся правила отображения для основных классов математических формул. Описывается метод решения задачи распознавания, основанного на обратной задаче получения графа изображения формулы.

    Saparov A.Y., Beltiukov A.P.
    Mathematical modeling of formula images for their recognition, pp. 153-167

    The work is devoted to the use of the basic elements of graph theory to solve the mathematical formula recognition problem. We introduce the concepts of two-level graphs and two-dimensional oriented graphs that make it possible to describe complex images consisting of the hierarchy of parts with a particular relative position. We consider a special function that builds a two-dimensional oriented graph from a mathematical formula; the graph is called a graph of mathematical expression image. The mapping rules for basic classes of mathematical formulae are presented. We describe a problem-solving procedure for a recognition problem, which is based on the reverse problem of constructing of a mathematical-expression image graph.

Журнал индексируется в Web of Science (Emerging Sources Citation Index)

Журнал индексируется в Scopus

Журнал входит в базы данных zbMATH, MathSciNet

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Журнал включен в перечень ВАК.

Электронная версия журнала на Общероссийском математическом портале Math-Net.Ru.

Журнал включен в Crossref