About Some Problems of Designing of Autonomous Robots

Lozhkin A.G., Maiorov K.N.

Abstract


The main methods of designing autonomous robots are briefly analyzed, including the automaton model, the classification automaton, the training with reinforcement based on the directional model, the homeostatic method for controlling the behavior of the robot. Deficiencies of methods that do not allow creating an autonomous robot operating in real time mode are identified. Some important works for the topic in the field of cognitive research and biochemistry are mentioned. The lack of a common point of view on the human thought process is shown. It is suggested to consider the autonomous robot and the environment of its work as a text in the language of mathematics. The concept of considering a robot on the basis of pragmatic and semantic analysis as part of semiotic analysis has been advanced. The main postulates of this approach are put forward. The four-level structure of the analysis of automorphisms for the decision making by the robot is formulated.

Keywords


autonomous robot; stochastic matrix; neural network; automorphism; pragmatics

Full Text

Робот, способный в заданной среде действовать самостоятельно, называется автономным. Такой робот должен обладать двумя свойствами при работе - получать знания об окружающей среде и оказывать на нее некоторое влияние. Предполагается, что окружающая среда является динамической системой. Робот должен иметь аппарат приспосабливания к любым изменениям среды. Теория и практика робототехники показала, что бывает недостаточно запрограммировать пример нужного поведения в исключительных ситуациях. Для успешной работы устройство должно самостоятельно создавать новые навыки поведения. Кратко рассмотрим основные подходы к задаче анализа поведения робота. Одной из наиболее эффективных и простых моделей условно-рефлекторного поведения является вероятностный автомат [1, 2]. Имеется устройство с n датчиками и m эффекторами (исполнительными механизмами). Рассматривается автомат с детерминированной матрицей переходов по всем 2n-сигналам. Действия автомат совершает в соответствии со стохастической матрицей размером где Q - количество состояний, Находясь в некотором состоянии и приняв на входе сигнал автомат переходит в состояние При этом он совершает действие выбираемое из соответствующего вектора вероятностей (строки матрицы P): Реакция автомата на входное воздействие оценивается наказанием или поощрением. Математически это заключается в изменении значений вероятностей выполняемых действий. Изменение вероятностей при поощрении (s = 0) и наказании (s = 1) можно представить как где g - параметр, определяющий скорость обучения. Таким образом, с течением времени в ходе обучения автомат должен сформировать необходимые значения вероятностей действий. Главным вопросом при конструировании робота является выбор оптимальной структуры автомата. При восьми исполнительных устройствах и десятке датчиков мы уже получаем достаточно внушительные входные и выходные алфавиты. Таким образом, учиться автомату приходится довольно долго. Робот, как правило, должен работать в режиме реального времени, поэтому увеличивать способности автомата к оценке ситуации за счет расширения стохастической матрицы фактически невозможно. Если аппаратная часть позволяет хранить большой объем информации, то быстродействие и количество процессоров ограничено. Одним из методов решения поставленной проблемы является классифицирующий автомат [3]. Он формирует последовательность стохастических матриц для каждого события на основе нейронных сетей или генетических алгоритмов. Проблема скорости заменяется проблемой выбора нужной стохастической матрицы. Одним из важнейших методов обучения и принятия решений являются нейронные сети. Применение нейронных сетей к автономным роботам заключается в инверсии основной задачи. Если определяющими данными в автоматах служат входные сигналы, то в данных методах особое внимание уделяется правильным решениям, принимаемым роботом. В настоящее время различают три важнейших подхода, или метода: - обучение с подкреплением на основе прямонаправленной модели [4]; - метод гомеокинеза для управления поведением робота [5]; - совмещенный метод [6]. Первый метод использует нейронную сеть, которая поделена на 2 части: сеть контроллера (сеть управления) и сеть модели (сеть прогнозов). Сеть контроллера получает данные сенсоров на вход, генерируя сигналы управления роботу. Определяющим при этом является корректная работа мехатронной системы. Решающим критерием для успеха обучения на основе гомеокинеза в управлении автономным роботом является ввод оптимального обучающего параметра, чтобы получить желаемое поведение и уменьшить ошибки в принятии решений. Проблема размера стохастической матрицы при данных подходах (скорости принятия решений) не исчезает. Увеличение нейронной сети приводит к увеличению времени принятия решения. Кроме того, если стохастическая матрица имеет хорошо описываемую структуру, то нейросеть представляет из себя неупорядоченное множество. Все эти методы основываются на предположении, что человек принимает решения только путем мыслительной деятельности. Для рассмотрения правильности данного подхода рассмотрим кратко когнитивные исследования. Важнейшим из открытий современных физиологов следует считать утверждение о том, что человек принимает решение определенной проблемы задолго до мыслительной деятельности [7, 8]. Современные биохимические исследования [9] выявили участок ДНК, который передает информацию об ориентации в пространстве без участия зрения. Данные исследования позволяют сделать вывод, что некоторые механизмы пространственной ориентации не связаны непосредственно со зрением. Мы предполагаем, что таким механизмом являются автоморфизмы (симметрии) пространства. Для решения вышеперечисленных проблем предлагается использовать классический семиотический анализ теории конечных автоматов, а именно наиболее неисследованную его часть - прагматику. Выдвинем несколько постулатов для определения методов исследования. 1. Каждый объект материального мира можно рассматривать как математический текст. 2. Любой марковский процесс направлен на сохранение участвующей в объекте исследования симметрии (автоморфизма). 3. Все симметрии делятся на два класса - симметрии как свойства конкретного объекта и симметрии как фундаментальные свойства среды. Автоморфизмы объекта свяжем с понятием симметрии по Вейлю. Симметрии среды свяжем с работами Дьедонне. Ранее была предложена таблица симметрий [10] на основе таблицы Дьедонне. Исходя из бинарного понятия автоморфизма Бахмана, количества и порядка симметрий предполагается, что множество автоморфизмов евклидова пространства совпадает с множеством и порядком базовых булевых функций двоичной логики. Выделенные симметрии обнаружены в различных проявлениях человеческой мыслительной деятельности [11]. Дополнительный механизм ориентации и поведения человека может быть связан со сравнением таблицы симметрий внутри человека (изменяющейся) и пространства (неизменного) [12]. Исходя из третьего постулата для ориентации автономного робота на основе автоморфизмов, необходимо учитывать следующие виды симметрий. 1. Фундаментальные свойства евклидова пространства. 2. Свойства объекта распознавания в среде. 3. Фундаментальные свойства нейронной сети. 4. Свойства данного набора нейронов, участвующих в процессе распознавания. На основе механизма распознавания человека, предложенного выше, симметрии среды будут неизменны, а симметрии 4-мерной мехатронной системы изменчивы. Данный подход может позволить ускорить работу автономного робота, улучшить качество распознавания, структурировать нейросеть.

Galleys

PDF (Русский)
References References

Der R., Pantzer T. Emergent robot behavior from the principle of homeokinesis. Technical report, Universität Leipzig, Institut für Informatik, 1999. 256 p.

Verwer S., Eyraud R., Higuera C. PAutomaC: a probabilistic automata and hidden Markov models learning competition. Mach. Learn. 96, 1-2 (July 2014), pp. 129-154.

Fatès N. Stochastic Cellular Automata Solutions to the Density Classification Problem: When Randomness Helps Computing. Theory of Computing Systems; New York, vol. 53, iss. 2 (Aug 2013), pp. 223-242.

Kober J., Bagnell J., Peters J. Reinforcement learning in robotics: A survey. The International Journal of Robotics Research, 32(11), 2013, pp. 1238-1274.

Bostrom N. Superintelligence: Paths, Dangers, Strategies. OUP Oxford, 2016, 432 p.

Kuniaki N., Hiroaki Ar., Yuki S., Tetsuya Og. Multimodal integration learning of robot behavior using deep neural networks. Robot. Auton. Syst. 62, 6 (June 2014), pp. 721-736.

Orsinia C. A., Moorman D. E,. Young J. W., Setlow B., Floresco S. B. Neural mechanisms regulating different forms of risk-related decision-making: Insights from animal models. Neuroscience & Biobehavioral Reviews, vol. 58, 2015, pp. 147-167.

Slioussar N., Kireev M. V., Chernigovskaya T. V., Kataeva G. V., Korotkov A. D., Medvedev S. V. An ER-fMRI study of Russian inflectional morphology. Brain Lang, vol. 130, 2014, pp.33-41. DOI: 10.1016/ j.bandl.2014.01.006.

Chesler A. T., Szczot M., Bharucha-Goebel D. and others. The Role of PIEZO2 in Human Mechanosensation N Engl J Med, vol. 375, pp.1355-1364, October 6, 2016. doi: 10.1056/NEJMoa1602812

Ложкин А., Дюкина Н. Структурирование аналитической геометрии на основе симметрий. Saarbrucken: LAP Lambert Academic Publishing, 2012. 176 с.

Ложкин А. Г. Симметрия как единое свойство пространства и живого организма // Тиетта. 2010. № 3(13). С. 23-32.

Lozhkin A., Shubin V., Suslov Y., Bimakov E. In the issue of robots design. Proceedings of the 2017 IEEE Russia Section Young Researchers in Electrical and Electronic Engineering ElConRus 2017, 3 February 2017, pp. 930-933.




DOI: http://dx.doi.org/10.22213/2413-1172-2017-4-114-116

Article Metrics

Metrics Loading ...

Metrics powered by PLOS ALM


Copyright (c) 2017 Bulletin of Kalashnikov ISTU

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.


ISSN 1813-7903 (Print)
ISSN 2413-1172 (Online)