References

inform

Информатика

Informatics

1816-03012617-6963

UIIP NASB

inform-869

Research Article

ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ

SIGNAL, IMAGE, SPEECH, TEXT PROCESSING AND PATTERN RECOGNITION

Экстраполирующее обучение нейронных сетей

Extrapolating training of neural networks

Бурый

Я. А.

Bury

Ya. A.

ассистент кафедры электронно-вычислительных машин

Assistant of the Department of Electronic Computing Machines

edidici@tut.by

Самаль

Д. И.

Samal

D. I.

кандидат технических наук, доцент, доцент кафедры электронных вычислительных машин

Cand. Sci. (Eng.), Assoc. Prof. of the Department of Electronic Computing Machines

samal@bsuir.by

Белорусский государственный университет информатики и радиоэлектроники, МинскBelarusian State University of Informatics and Radioelectronics, Minsk

2019

26032019

1618692

2019

Бурый Я.А., Самаль Д.И.

Bury Y.A., Samal D.I.

Данная работа распространяется под лицензией Creative Commons Attribution 4.0.

This work is licensed under a Creative Commons Attribution 4.0 License.

https://inf.grid.by/jour/article/view/869

Рассматривается способ обучения нейронных сетей, согласно которому знания, содержащиеся в одной сети, используются для обобщения входных сигналов, соответствующих неизвестным ей классам, с целью обучения на них другой нейронной сети с более простой архитектурой. Исследуется возможность применения реакции выходного сигнала обученной системы распознавания рукописных символов на предъявляемые ей изображения отсутствующих в исходной обучающей выборке символов с целью обобщения и последующей экстраполяции этой реакции в однозначно интерпретируемый выход другой системы в процессе ее обучения распознаванию новых классов. Подобно тому как человек в процессе познания способен осваивать все более сложные понятия и быстрее обучаться новым знаниям в зависимости от объема уже усвоенной информации, а также сохранять в памяти знания, которые были получены ранее, предлагаемый способ позволяет использовать результат обобщения входного сигнала уже обученной системы для освоения новых знаний за более короткое время, а также повышать ее точность без необходимости повторения всего цикла обучения, а следовательно, без изменения усвоенных прежде знаний. Представленный способ может применяться для оптимизации процесса обучения систем распознавания, увеличения точности уже обученных систем, а также для переобучения или дообучения их распознаванию новых классов без необходимости повторного обучения на исходном обучающем множестве.

An approach for training neural networks is presented. The point is the knowledge contained in one network are used to generalize the input signals that are corresponded to classes what are unknown to it, in order to train them by another neural network with a simpler architecture. The paper observes the possibility of using the output signal of a trained handwriting recognition system on the images what are presented to it and which are absent in the original training set of symbols. This training process is performing in order to generalize and then extrapolate the reaction to the uniquely interpreted output of another system during its training to those unknown classes. Like a person in the process of studying what is able to perceive more and more complex concepts and learn new knowledge faster depending on already acquired information, as well as when learning new data – to keep in memory those that were obtained earlier, the approach allows us to use the result of input signal generalization from already trained system in the aim to perceive of new knowledge in a shorter time. Also it allows increasing the accuracy of the recognition process without a necessity to repeat the entire training cycle, and therefore – without changing the previously acquired knowledge in the net. The presented approach can be used to optimize the training process of recognition systems, increase the accuracy of already trained systems, and also to retrain or additional training them to new classes without the need to retrain the original training set.

нейронные сетинейронная сеть сверткираспознавание изображенийраспознавание символовобучение нейронных сетей

neural networksconvolutional neural networkcharacter recognitionimage recognitionneural networks training

References1

Хайкин, С. Нейронные сети. Полный курс / С. Хайкин. – М., СПб., Киев : Вильямс, 2006. – 1104 с.

Haykin S. Neyronnyye seti. Polnyy kurs. Neural Networks. Full Course. Moscow, Saint Petersburg, Kiev, Vil'jams, 2006, 1104 p. (in Russian).

Николенко, С. Глубокое обучение. Погружение в мир нейронных сетей / С. Николенко, А. Кадурин,

Nikolenko S., Kadurin A., Arhangel'skaja E. Glubokoye obucheniye. Pogruzheniye v mir neyronnykh

Е. Архангельская. – СПб. : Питер, 2018. – 480 с.

setey. Deep Learning. Immersion in the World of Neural Networks. Saint Petersburg, Piter, 2018, 480 p. (in Russian).

Головко, В. А. Нейронные сети: обучение, организация и применение. Кн. 4 / В. А. Головко ; под ред. А. И. Галушкина. – М. : ИПРЖР, 2001. – 256 с.

Golovko V. A. Neyronnyye seti: obucheniye, organizatsiya i primeneniye. Neural Networks: Training, Organization and Application. Moscow, IPRZhR, 2001, 256 p. (in Russian).

База изображений «The MNIST database of handwritten digits» [Электронный ресурс]. – Режим доступа: http: //yann.lecun.com/exdb/mnist. – Дата доступа: 12.09.2018.

Baza izobrazhenij "The MNIST database of handwritten digits". Images dataset "The MNIST database of handwritten digits". Available at: http:// yann.lecun.com/exdb/mnist/ (accessed 12.09.2018).

Монтгомери, Д. К. Планирование эксперимента и анализ данных : сокр. пер. с англ. В. А. Коптяева / Д. К. Монтгомери. – Л. : Судостроение, 1980. – 384 с.

Montgomeri D. K. Design and Analysis of Experiments. 9th edition. New York, John Wiley & Sons, Inc., 2017, 640 p.

The authors declare that there are no conflicts of interest present.