Automated System for Evaluating 2D-Image Compositional Characteristics: Mathematical Model

Al Akkad M.A., Gazimzyanov F.F.

Abstract


Mathematical model creation was presented in a previous publication of the authors. It is the concept of an automated system for estimating the compositional characteristics of 2D images. Rudolf Arnheim's experiment to determine the visual weight of objects using the structural plan of a square and a dark disk is repeated using a mathematical representation of the concepts given in the book "Art and Visual Perception". The structural plan is used as a frame of reference, which has key points, lines and coordinates. The parameters of objects and formulas for calculating the magnitude of the perceptual forces influence are described. A method for estimating the balance of a visual scene is proposed. The mathematical model of Arnheim’s experiment is represented in different stages, with a different position of the object in the visual scene relative to the source of perceptual force being investigated. The factors that affect object’s perception within the structural plan, and the features of the key positions of the objects are explained. An experimentally constructed function to determine the visual weight of an object is proposed depending on the distance to source of the perceptual forces. Akima spline interpolation method was used for obtaining a qualitative graph of the function, devoid of "oscillations" near extremes and with sharp changes in values. The alternative graphs of functions for various sources of influence of perceptive forces are offered, and the difference in the principles of the action of different sources is explained. The coefficients for different perceptive factors and sources of influence are introduced, which will ensure accurate tuning of the system. A method for adjusting the coefficients of the system is proposed. The obtained mathematical model confirms the possibility of program realization of the methods proposed by Arnheim.

Keywords


R. Arnheim; H. Akima; image analysis; compositional characteristics; balance; mathematical model; interpolation

Full Text

Введение В предыдущей статье [1] авторы предложили общую концепцию автоматизированной системы оценки композиционных характеристик 2D-изображений. Напомним, что в книге Арнхейма [2] вводятся системы отсчета и зависимости, на которые автор опирается в своих рассуждениях. Это позволяет построить математическую модель для методов зависимостей, изложенных в книге. Разработка математической модели и методов Для примера рассмотрим главу «Равновесие» из книги Арнхейма [3, с. 23]. Структурный план [4, с. 26] в первой главе книги Рудольфа Арнхейма (рис. 1, а) можно представить как квадрат с центром и сторонами m и n. Точка A имеет координаты , а точка D - . Рис. 1 Объект (в примере из книги это круг) содержит такие параметры, как визуальный вес, визуальное направление, координаты центра массы: , где - визуальный вес; - визуальное направление, а - координаты центра масс. Оценку равновесия сцены можно представить как функцию , где O - это объекты сцены. Чем ближе результат функции к нулю, тем лучше сбалансирована модель с точки зрения параметров, описанных в первой главе. Рассмотрим некоторые параметры. Проанализировав рассуждения Арнхейма и приведенные примеры [5, с. 25], можно сделать вывод, что визуальный вес объекта зависит от влияния перцептивных сил каждого элемента структурного плана: , (1) где - перцептивная сила; - коэффициент влияния фактора силы, речь о котором пойдет позже. Перцептивная сила, в свою очередь, может быть выражена как функция от расстояния от центра масс объекта до нужного объекта структурного плана: , (2) где - перцептивная сила; - расстояние от определенного объекта структурного плана до центра масс объекта. Если учесть описанное в книге, можно предположить, что функция для вычисления влияния перцептивных сил краев структурного плана может иметь вид, изображенный на рис. 1, б. Для получения функции данного графика можно провести интерполяцию сплайном Акимы [6]. Применение этого метода позволит получить график функции, очень похожий на оригинальный график, нарисованный человеком. В нем будет отсутствовать раскачивание, «осцилляции» при резких сменах значений функции, которые мы бы получили при интерполяции кубическим сплайном или другими методами. Рассмотрим влияние источника перцептивной силы - отрезка . На рис. 1, в круг располагается внутри квадрата на существенном расстоянии от отрезка , поэтому влияние перцептивных сил не столь велико. Это отмечено на графике функции красной линией. На рис. 2, а рассматривается стабильное положение круга, при котором расстояние от центра масс фигуры равно радиусу круга: , где - расстояние от центра масс фигуры до отрезка ; - радиус объекта. Рис. 2 В таком положении человек воспринимает положение круга как стабильное [7, с. 41], поскольку это подсказывает опыт восприятия - круг «стоит» на поверхности или прикреплен к ней. Поэтому на графике для этого значения существует точка максимума. Однако все еще существует некоторое стремление в сторону . На рис. 2, б круг продолжил движение в сторону . Он находится в крайне неустойчивом положении, поскольку сейчас его стремление занять свою позицию на максимально. Как показывает Арнхейм в своих экспериментах [8, с. 35], человеческое восприятие стремится к простым и правильным формам. Это отражено на графике. На рис. 2, в круг становится точно на отрезок , . Может показаться, что это стабильное положение, однако, как показано в опытах [107, с. 41], существуют определенные особенности восприятия верхней и нижней части фигуры. Поэтому, хоть объект, с точки зрения геометрии, и занял стабильное положение, для зрителя он не будет казаться стабильным, в нем существует некоторое стремление «наружу» структурного плана. Поэтому график функции в этой точке не будет максимальным. Учитывая опыты [9, с. 27, 35, 41], положение круга внутри квадрата с небольшим значением воспринимается человеком как стабильное положение прямо на отрезке . Поэтому это и будет максимальным значением графика функции (рис. 2, г). Такие же графики функции можно вывести для диагональных и вертикальных линий внутри структурного плана, основываясь на экспериментах и выводах Р. Арнхейма. Отметим, что оба графика (рис. 3) не имеют снижения при приближении значения по оси к нулю. Это связано с тем, что внутренних структурных линий человек не видит, а следовательно, не может применить перцептивный опыт «стоящего» или «прикрепленного» к какому-то основанию объекта. Также важно отметить, что диапазон значений на оси отличается. Рис. 3 Точно так же можно вычислить влияние цвета или размера объекта на его визуальный вес. Оси симметрии, центр масс, влияние структурного позволят вычислить визуальное направление объекта. Такой же подход возможен и для других характеристик и зависимостей, описанных в книге. Вернемся к формуле (1). Ранее был упомянут коэффициент влияния фактора силы . Это очень важный момент, поскольку невозможно, основываясь только на книге Арнхейма и личном опыте, настроить такую сложную систему, состоящую из огромного количества различных параметров. При оценке равновесия сцены будет производиться расчет величин влияния разных параметров, и меру влияния параметров будут определять соответствующие коэффициенты. Например, визуальный вес объекта определяется такими факторами, как влияние структурного плана, влияние цвета и яркости, влияние размера: , где - визуальный вес, определенный структурным планом; - определенный цветом, а - размером: , где каждый - влияние определенного источника структурного плана на вес объекта. И каждый такой источник имеет свой коэффициент влияния на общую оценку. Коэффициенты нужны для точной настройки системы относительно человеческого восприятия. После реализации методов системы планируется провести анкетирование среди разных групп людей. Респондентам будет предложено оценить по шкале от 1 до 5 различные композиции, состоящие из объектов, находящихся внутри квадрата. Оценки респондентов будут использованы для настройки соответствующих коэффициентов системы. Например, функция зависимости влияния перцептивных сил (формула (2)) может быть интерполирована по другим значениям, взятым из результатов анкетирования. А влияние различных факторов с коэффициентами, записанное как многочлен, может быть настроено методом наименьших квадратов. Вывод Структура книги Р. Арнхейма, его методы и обоснования зависимостей удобны при выражении их в математической модели. Это делает возможным создание автоматизированной системы оценки эстетических характеристик 2D-изображения. Авторами был предложен вариант математической модели для первой главы книги «Равновесие», которая позволит получить композиционные характеристики объектов, расположенных внутри структурного плана. Таким образом, возможно создание ПО, использующее данный математический аппарат, которое позволит проверить его на практике и настроить, проведя анкетирование.

Galleys

PDF (Русский)
References References

Аль Аккад М. Айман, Газимзянов Ф. Ф. Автоматизированная система оценки композиционных характеристик 2D-изображения: концепция // Вестник ИжГТУ имени М. Т. Калашникова. - 2017. - T. 20, № 2. - С. 160-162.

Арнхейм Р. Искусство и визуальное восприятие. - Благовещенск : БГК им. И. А. Бодуэна де Куртене, 2000. - 392 с.

Там же. С. 26.

Там же. С. 25.

Hiroshi Akima. A New Method of Interpolation and Smooth Curve Fitting Based on Local Procedures. Journal of the ACM (JACM), 1970. - C. 589-602.

Арнхейм Р. Указ. соч. С. 41.

Там же. С. 35.

Там же. С. 41.

Там же. С. 27, 35, 41.




DOI: http://dx.doi.org/10.22213/2410-9304-2017-2-105-108

Article Metrics

Metrics Loading ...

Metrics powered by PLOS ALM

Refbacks

  • There are currently no refbacks.


Copyright (c) 2017 Аль А.А., Газимзянов Ф.Ф.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

ISSN 1813-7911