<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">inform</journal-id><journal-title-group><journal-title xml:lang="ru">Информатика</journal-title><trans-title-group xml:lang="en"><trans-title>Informatics</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1816-0301</issn><issn pub-type="epub">2617-6963</issn><publisher><publisher-name>UIIP NASB</publisher-name></publisher></journal-meta><article-meta><article-id custom-type="elpub" pub-id-type="custom">inform-869</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ОБРАБОТКА СИГНАЛОВ, ИЗОБРАЖЕНИЙ, РЕЧИ, ТЕКСТА И РАСПОЗНАВАНИЕ ОБРАЗОВ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>SIGNAL, IMAGE, SPEECH, TEXT PROCESSING AND PATTERN RECOGNITION</subject></subj-group></article-categories><title-group><article-title>Экстраполирующее обучение нейронных сетей</article-title><trans-title-group xml:lang="en"><trans-title>Extrapolating training of neural networks</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Бурый</surname><given-names>Я. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Bury</surname><given-names>Ya. A.</given-names></name></name-alternatives><bio xml:lang="ru"><p>ассистент кафедры электронно-вычислительных машин</p></bio><bio xml:lang="en"><p>Assistant of the Department of Electronic Computing Machines</p></bio><email xlink:type="simple">edidici@tut.by</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Самаль</surname><given-names>Д. И.</given-names></name><name name-style="western" xml:lang="en"><surname>Samal</surname><given-names>D. I.</given-names></name></name-alternatives><bio xml:lang="ru"><p>кандидат технических наук, доцент, доцент кафедры электронных вычислительных машин</p></bio><bio xml:lang="en"><p>Cand. Sci. (Eng.), Assoc. Prof. of the Department of Electronic Computing Machines</p></bio><email xlink:type="simple">samal@bsuir.by</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Белорусский государственный университет информатики и радиоэлектроники, Минск</institution></aff><aff xml:lang="en"><institution>Belarusian State University of Informatics and Radioelectronics, Minsk</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2019</year></pub-date><pub-date pub-type="epub"><day>26</day><month>03</month><year>2019</year></pub-date><volume>16</volume><issue>1</issue><fpage>86</fpage><lpage>92</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Бурый Я.А., Самаль Д.И., 2019</copyright-statement><copyright-year>2019</copyright-year><copyright-holder xml:lang="ru">Бурый Я.А., Самаль Д.И.</copyright-holder><copyright-holder xml:lang="en">Bury Y.A., Samal D.I.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://inf.grid.by/jour/article/view/869">https://inf.grid.by/jour/article/view/869</self-uri><abstract><p>Рассматривается способ обучения нейронных сетей, согласно которому знания, содержащиеся в одной сети, используются для обобщения входных сигналов, соответствующих неизвестным ей классам, с целью обучения на них другой нейронной сети с более простой архитектурой. Исследуется возможность применения реакции выходного сигнала обученной системы распознавания рукописных символов на предъявляемые ей изображения отсутствующих в исходной обучающей выборке символов с целью обобщения и последующей экстраполяции этой реакции в однозначно интерпретируемый выход другой системы в процессе ее обучения распознаванию новых классов. Подобно тому как человек в процессе познания способен осваивать все более сложные понятия и быстрее обучаться новым знаниям в зависимости от объема уже усвоенной информации, а также сохранять в памяти знания, которые были получены ранее, предлагаемый способ позволяет использовать результат обобщения входного сигнала уже обученной системы для освоения новых знаний за более короткое время, а также повышать ее точность без необходимости повторения всего цикла обучения, а следовательно, без изменения усвоенных прежде знаний. Представленный способ может применяться для оптимизации процесса обучения систем распознавания, увеличения точности уже обученных систем, а также для переобучения или дообучения их распознаванию новых классов без необходимости повторного обучения на исходном обучающем множестве.</p></abstract><trans-abstract xml:lang="en"><p>An approach for training neural networks is presented. The point is the knowledge contained in one network are used to generalize the input signals that are corresponded to classes what are unknown to it, in order to train them by another neural network with a simpler architecture. The paper observes the possibility of using the output signal of a trained handwriting recognition system on the images what are presented to it and which are absent in the original training set of symbols. This training process is performing in order to generalize and then extrapolate the reaction to the uniquely interpreted output of another system during its training to those unknown classes. Like a person in the process of studying what is able to perceive more and more complex concepts and learn new knowledge faster depending on already acquired information, as well as when learning new data – to keep in memory those that were obtained earlier, the approach allows us to use the result of input signal generalization from already trained system in the aim to perceive of new knowledge in a shorter time. Also it allows increasing the accuracy of the recognition process without a necessity to repeat the entire training cycle, and therefore – without changing the previously acquired knowledge in the net. The presented approach can be used to optimize the training process of recognition systems, increase the accuracy of already trained systems, and also to retrain or additional training them to new classes without the need to retrain the original training set.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>нейронные сети</kwd><kwd>нейронная сеть свертки</kwd><kwd>распознавание изображений</kwd><kwd>распознавание символов</kwd><kwd>обучение нейронных сетей</kwd></kwd-group><kwd-group xml:lang="en"><kwd>neural networks</kwd><kwd>convolutional neural network</kwd><kwd>character recognition</kwd><kwd>image recognition</kwd><kwd>neural networks training</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Хайкин, С. Нейронные сети. Полный курс / С. Хайкин. – М., СПб., Киев : Вильямс, 2006. – 1104 с.</mixed-citation><mixed-citation xml:lang="en">Haykin S. Neyronnyye seti. Polnyy kurs. Neural Networks. Full Course. Moscow, Saint Petersburg, Kiev, Vil'jams, 2006, 1104 p. (in Russian).</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Николенко, С. Глубокое обучение. Погружение в мир нейронных сетей / С. Николенко, А. Кадурин,</mixed-citation><mixed-citation xml:lang="en">Nikolenko S., Kadurin A., Arhangel'skaja E. Glubokoye obucheniye. Pogruzheniye v mir neyronnykh</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Е. Архангельская. – СПб. : Питер, 2018. – 480 с.</mixed-citation><mixed-citation xml:lang="en">setey. Deep Learning. Immersion in the World of Neural Networks. Saint Petersburg, Piter, 2018, 480 p. (in Russian).</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Головко, В. А. Нейронные сети: обучение, организация и применение. Кн. 4 / В. А. Головко ; под ред. А. И. Галушкина. – М. : ИПРЖР, 2001. – 256 с.</mixed-citation><mixed-citation xml:lang="en">Golovko V. A. Neyronnyye seti: obucheniye, organizatsiya i primeneniye. Neural Networks: Training, Organization and Application. Moscow, IPRZhR, 2001, 256 p. (in Russian).</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">База изображений «The MNIST database of handwritten digits» [Электронный ресурс]. – Режим доступа: http: //yann.lecun.com/exdb/mnist. – Дата доступа: 12.09.2018.</mixed-citation><mixed-citation xml:lang="en">Baza izobrazhenij "The MNIST database of handwritten digits". Images dataset "The MNIST database of handwritten digits". Available at: http:// yann.lecun.com/exdb/mnist/ (accessed 12.09.2018).</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Монтгомери, Д. К. Планирование эксперимента и анализ данных : сокр. пер. с англ. В. А. Коптяева / Д. К. Монтгомери. – Л. : Судостроение, 1980. – 384 с.</mixed-citation><mixed-citation xml:lang="en">Montgomeri D. K. Design and Analysis of Experiments. 9th edition. New York, John Wiley &amp; Sons, Inc., 2017, 640 p.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
