Method of Digitally Presented Texts Extraction from the Image of a Document and their Examination

Authors

  • A. A. Allaberganov Tomsk State University of Control Systems and Radioelectronics (Tomsk), Judicial Expert Criminalistic Laboratory at the management company "NSK-Capital" (Novosibirsk)
  • M. Y. Kataev Tomsk State University of Control Systems and Radioelectronics

DOI:

https://doi.org/10.22213/2410-9304-2023-2-27-40

Keywords:

information extracting, brightness histograms, document details, paper, authenticity, digital images, document

Abstract

In this work, the problems of extracting textual information from a document image are solved. It is important to note that the work includes complex use of special knowledge in three areas: technical and forensic examination of documents; phototechnical expertise and computer-technical expertise. The article considers and demonstrates in detail the information for detecting changes in textual information (ink, toner and writing instrument pastes) from digital images. The commission of crimes in the economic sphere, as a rule, is associated with the falsification (forgery) of documents, and the increase in the document flow in the regulation of legal relations, which has been noticeable in recent years, has led to a significant increase in the number of forged documents. This is confirmed by statistical data on forensic handwriting and technical forensic examinations. Since the document is the basis of all human activity, and it contains data drawn up in a certain order and having legal significance. The problem has got many interesting solutions thanks to practical applications such as text recognition, translation, forensics and etc. Despite the fact that this problem has been dealt with for a long time, it is still missing, i.e. there is no well-developed methodology for image recognition of documents. The image of text information depends on the type of scene, type of digital camera, amount and direction of illumination, type of substrate and etc. It is important to note here that when obtaining information (from the document under study) in modern conditions, it is possible to fix the document using any device (camera, smartphone, scanner and etc.) and in any conditions (day/night, street, radiation source) that are unknown in advance. Proceeding from this, and this is a problem in modern conditions, in the study of electronic digital information of text documents. In this work, a study to solve this problem was carried out.

Author Biographies

A. A. Allaberganov, Tomsk State University of Control Systems and Radioelectronics (Tomsk), Judicial Expert Criminalistic Laboratory at the management company "NSK-Capital" (Novosibirsk)

Post-graduate

M. Y. Kataev, Tomsk State University of Control Systems and Radioelectronics

DSc in Engineering, Professor

References

Шандаров В. М. Волоконно-оптические устройства технологического назначения: учеб. пособие. Томск: ТУСУР, 2012. 198 с.

Пихтин А. Н. Квантовая и оптическая электроника: учебник для вузов. М.: Абрис, 2012. 656 с.

Аллаберганов А. А., Катаев М. Ю. Метод получения цифрового двойника бумажного носителя // Право и практика. 2020. № 1. С. 80-85.

Пихтин А. Физические основы квантовой электроники и оптоэлектроники. М.: Высш. шк., 2018. 304 c.

Заказнов Н. П., Кирюшин С. И., Кузичев В. И. Теория оптических систем. М.: Лань, 2016. 448 c.

Дифракционная компьютерная оптика / под ред. В. А. Сойфера. М.: Наука, 2017. 736 c.

Ахманов С. А., Никитин С. Ю. Физическая оптика. М.: Издательство МГУ, Наука, 2018. 654 c.

Акустооптические лазерные системы формирования телевизионных изображений / Ю. В. Гуляев, М. А. Казарян, Ю. М. Мокрушин, О. Шакин. М.: Физматлит, 2016. 240 c.

Аллаберганов А. А., Катаев М. Ю. Оптоэлектроника как основа метода распознания и идентификации лица путем декомпозиции и распознания, идентификация лиц с дальней дистанции в агрессивных условиях (с получением цифрового двойника). Судебная практика: монография. Томск: Томск. гос. ун-т систем упр. и радиоэлектроники; Москва: Знание-М, 2022. 120 с.

Аллаберганов А. А. Комплексные судебные экспертизы документов, изготовленных путем монтажа с использованием цифровых технологий (юридические науки). Использование оптических устройств для распознания и анализа текстовой информации, представленной в виде изображений (технические науки): монография. Томск: Томск. гос. ун-т систем упр. и радиоэлектроники; Москва: Знание-М, 2022. 118 с.

Серебренников Л. Я., Шандаров С. М., Буримов Н. И. Акустоэлектронные приборы и устройства: учеб. пособие. Томск: ТУСУР, 2012. 70 с.

Allaberganov A. A. and Kataev M. Yu. Methodology for obtaining textual information from images and its analysis // Scopus. 2020. Р. 1-6.

Шандаров В. М. Волоконно-оптические устройства технологического назначения: учеб. пособие. Томск: ТУСУР, 2012. 198 с.

Фоторефрактивные эффекты в электрооптических кристаллах: учеб. пособие / В. М. Шандаров, А. Е. Мандель, С. М. Шандаров, Н. И. Буримов. Томск: ТУСУР, 2012. 244 с.

Янг М. Оптика и лазеры, включая волоконную оптику и оптические волноводы. М.: Мир, 2018. 544 c.

Published

30.06.2023

How to Cite

Allaberganov А. А., & Kataev М. Ю. (2023). Method of Digitally Presented Texts Extraction from the Image of a Document and their Examination. Intellekt. Sist. Proizv., 21(2), 27–40. https://doi.org/10.22213/2410-9304-2023-2-27-40

Issue

Section

Articles