<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN"
        "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<!--<?xml-stylesheet type="text/xsl" href="article.xsl"?>-->
<article article-type="research-article" dtd-version="1.2" xml:lang="en" xmlns:mml="http://www.w3.org/1998/Math/MathML"
         xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
    <front>
        <journal-meta>
            <journal-id journal-id-type="issn">2303-9868</journal-id>
            <journal-id journal-id-type="eissn">2227-6017</journal-id>
            <journal-title-group>
                <journal-title>Международный научно-исследовательский журнал</journal-title>
            </journal-title-group>
            <issn pub-type="epub">2303-9868</issn>
            <publisher>
                <publisher-name>ООО Цифра</publisher-name>
            </publisher>
        </journal-meta>
        <article-meta>
            <article-id pub-id-type="doi">None</article-id>
            <article-categories>
                <subj-group>
                    <subject>Brief communication</subject>
                </subj-group>
            </article-categories>
            <title-group>
                <article-title>СРАВНЕНИЕ ФУНКЦИЙ АКТИВАЦИИ SOFTMAX И СИГМОИДА В КОНТЕКСТЕ МНОГОКЛАССОВОЙ КЛАССИФИКАЦИИ РАСПОЗНАВАНИЯ ОБЪЕКТОВ
                </article-title>
            </title-group>
            <contrib-group>
                <contrib contrib-type="author">
                    <contrib-id contrib-id-type="orcid">https://orcid.org/0009-0000-5608-677X</contrib-id>
                    <name>
                        <surname>Нгуен</surname>
                        <given-names>Куй Тхань</given-names>
                    </name>
                    <email>thanhnq112@mail.ru</email>
                    <xref ref-type="aff" rid="aff-1">1</xref>

                </contrib><contrib contrib-type="author" corresp="yes">
                    <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-6961-6212</contrib-id>
                    <name>
                        <surname>Боровик</surname>
                        <given-names>Ирина Геннадьевна</given-names>
                    </name>
                    <email>big@bmstu.ru</email>
                    
                </contrib>
            </contrib-group>
            <aff id="aff-1"><label>1</label>Московский государственный технический университет им. Н.Э. Баумана</aff>
            
            
            <volume>7</volume>
            
            <fpage>1</fpage>
            <lpage>7</lpage>
            <history>
                
        <date date-type="received" iso-8601-date="2024-03-24">
            <day>24</day>
            <month>03</month>
            <year>2024</year>
        </date>
        
                
        <date date-type="accepted" iso-8601-date="2024-06-11">
            <day>11</day>
            <month>06</month>
            <year>2024</year>
        </date>
        
            </history>
            <permissions>
                <copyright-statement>Copyright: &#x00A9; 2022 The Author(s)</copyright-statement>
                <copyright-year>2022</copyright-year>
                <license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
                    <license-p>This is an open-access article distributed under the terms of the Creative Commons
                        Attribution 4.0 International License (CC-BY 4.0), which permits unrestricted use, distribution,
                        and reproduction in any medium, provided the original author and source are credited. See <uri
                                xlink:href="http://creativecommons.org/licenses/by/4.0/">
                            http://creativecommons.org/licenses/by/4.0/</uri>.
                    </license-p>
                </license>
            </permissions>
            <self-uri xlink:href=""/>
            <abstract>
                <p>Данная статья исследует важную проблему, связанную с применением функции softmax в задачах многоклассовой классификации объектов. В статье описывается структура и работа искусственного нейрона, а также принцип действия функций активации на примере сумматора. В частности, рассматривается ситуация, когда входные данные не соответствуют ни одному из классов в наборе данных, что может привести к неправильным выводам модели. Это ставит под сомнение точность классификации и требует системного контроля и обработки таких случаев. В статье предлагается альтернативный подход с использованием сигмоидальной функции активации и установлением порогового значения для определения принадлежности объекта к классам классификации. Этот подход позволяет более точно оценивать результаты классификации и избегать ложных выводов.</p>
            </abstract>
            <kwd-group>
                <kwd>компьютерное зрение</kwd>
<kwd> нейронные сети</kwd>
<kwd> функция активации</kwd>
<kwd> softmax</kwd>
<kwd> сигмоидальная функция активации</kwd>
<kwd> классификация объектов</kwd>
<kwd> распознавание</kwd>
<kwd> обработка изображений</kwd>
</kwd-group>
        </article-meta>
    </front>
    <body> 
        
 
        
<sec>
	<title>HTML-content</title>
	<p>1. Введение</p>
	<p>В создании искусственных нейронных сетей одним из ключевых аспектов является выбор функции активации. Эта функция определяет поведение нейрона и формирует выходной сигнал в зависимости от входных данных. Среди различных функций активации функции softmax и сигмоиды играют особенно важную роль в задачах классификации.</p>
	<p>В данном исследовании мы сосредоточимся на проблеме, которая возникает при использовании функции softmax в задачах многоклассовой классификации, когда входные данные не соответствуют ни одному из классов в наборе данных. Это может привести к неправильным выводам и потребности в контроле таких ситуаций.</p>
	<p>Далее мы предложим альтернативный подход, в котором используется функция активации сигмоиды и устанавливается пороговое значение для определения принадлежности объекта к классам классификации. Этот подход позволяет улучшить точность классификации и избежать ложных результатов.</p>
	<p>2. Основы функций активации
и математические уравнения функции softmax и сигмоиды</p>
	<fig id="F1">
		<label>Figure 1</label>
		<caption>
			<p>Структурная схема искусственного нейрона</p>
		</caption>
		<alt-text>Структурная схема искусственного нейрона</alt-text>
		<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="/media/images/2024-06-13/875362c0-6e15-4c20-b59c-54e0b7e06c9d.png"/>
	</fig>
	<p>Одним из важных факторов при создании искусственных нейронных сетей вообще и нейронных сетей распознавания объектов в частности является выбор функции активации. От выбранной функции активации зависят функциональные возможности нейронной сети и выбор метода для её обучения. Функция активации описывает выходное значение нейрона в зависимости от взвешенной суммы его входов и порогового значения срабатывания [1]. На рисунке 1 представлена структурная схема искусственного нейрона.Нейронный сумматор осуществляет алгебраическое суммирование взвешенных входных сигналов. Математическое выражение для вычисления выходного сигнала сумматора S имеет следующий вид:</p>
	<p>где: </p>
	<p>Сумматор генерирует выходной сигнал net, который затем преобразуется функцией активации. Формула для вычисления net:</p>
	<p>где </p>
	<p>Функция активации </p>
	<p>В задачах распознавания объектов на изображениях доминируют сверточные нейронные сети (СНС). СНС состоит из сверточных слоев и слоев пулинга, последовательно соединенных друг с другом. Далее эти слои подключаются к полностью связанному слою, который формирует выходные данные. Перед формированием выходных данных используются функции активации. Наиболее распространенные функции активации: Функция softmax и сигмоидальная функция.</p>
	<p>3. Сигмоидальная функция</p>
	<p>Сигмоидальная функция активации – это нелинейная функция, которая преобразует входное значение в диапазоне от отрицательной бесконечности до положительной бесконечности в значение от 0 до 1. Эта функция активации часто используется в нейронных сетях для задач бинарной классификации </p>
	<p>[2]</p>
	<p>Сигмоидальная функция активации представлена формулой [3]:</p>
	<fig id="F2">
		<label>Figure 2</label>
		<caption>
			<p>График сигмоидальной функции активации</p>
		</caption>
		<alt-text>График сигмоидальной функции активации</alt-text>
		<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="/media/images/2024-06-13/ce4352d5-d0a5-453f-918e-53881023fabb.png"/>
	</fig>
	<p>Параметр α влияет на крутизну функции. Чем он больше, тем более круче функция. Данным параметром можно задать диапазон входных значений, которые не будут прилегать к минимуму или максимуму функции. Графически сигмоидальная функция активации выглядит как S-образная кривая, которая монотонно возрастает и имеет асимптоты на 0 и 1. В частности, если x &gt; 0, то f(x) &gt; 0.5, а если x &lt; 0, то f(x) &lt; 0.5. Значение 0.5 достигается при x = 0 (см. рис. 2).</p>
	<p>4. Функция Softmax</p>
	<p>Функция Softmax используется для преобразования вектора значений в вероятностное распределение, которое суммируется до 1 </p>
	<p>[4]</p>
	<p>Формула функции Softmax выглядит следующим образом:</p>
	<p>где </p>
	<p>График функции Softmax представляет собой гладкую кривую, начинающуюся от 0 и заканчивающуюся на 1, что соответствует сумме вероятностей всех элементов вектора. Кривая функции Softmax имеет свойство, что вероятность любого элемента вектора увеличивается, если значения других элементов уменьшаются, что позволяет использовать эту функцию для многоклассовой классификации </p>
	<fig id="F3">
		<label>Figure 3</label>
		<caption>
			<p>График функции softmax, соответствующий входному вектору z = [1, 2, 3, 4, 1, 2, 3]</p>
		</caption>
		<alt-text>График функции softmax, соответствующий входному вектору z = [1, 2, 3, 4, 1, 2, 3]</alt-text>
		<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="/media/images/2024-06-13/a0239a29-24d1-487f-89ce-22753b5be920.png"/>
	</fig>
	<p>[5]</p>
	<p>5. Проблема для задачи многоклассовой классификации</p>
	<p>Как упоминалось выше, функция softmax широко используется в задачах многоклассовой классификации. Из-за природы функции softmax все выходные значения будут представлять собой вероятности каждого класса. Независимо от того, какой класс имеет наибольшее значение вероятности, система предсказывает, что входное изображение принадлежит именно этому классу.</p>
	<p>Однако, при рассмотрении конкретного примера, такого как классификация знаковых зданий города Москвы </p>
	<p>[6]</p>
	<fig id="F4">
		<label>Figure 4</label>
		<caption>
			<p>Образец изображения храма Спаса на Крови</p>
		</caption>
		<alt-text>Образец изображения храма Спаса на Крови</alt-text>
		<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="/media/images/2024-06-13/add102a1-456b-4900-9651-1d85475778d3.jpg"/>
	</fig>
	<p>Сверимся с изображением храма Спаса на Крови, расположенным в городе Санкт-Петербург (см. рис. 4). Очевидно, что это изображение не соответствует ни одному классу в наборе данных (поскольку набор данных представляет собой здания в Москве).Даже многие люди могут спутать храм Спаса на Крови с собором Василия Блаженного, потому что они имеют схожую архитектуру. Модель классификации, обученная с помощью трансферного обучения на основе модели InceptionV3 [7], также предсказала, что на изображении изображено здание Василия Блаженного. Ниже приведен результат модели, если последний слой использует функцию активации softmax:</p>
	<p>[[4.2251e-07 8.3223e-06 1.1393e-05 1.3564e-05 2.9395e-06 0.00018633 0.00048449 1.2825e-05 2.5042e-08 4.021e-07 0.99911 0.0001692 2.4293e-09]]</p>
	<p>index max: 10</p>
	<p>label predict: St. Basils Cathedral</p>
	<p>Из результатов видно, что модель, использующая функцию активации softmax, достигает очень высоких результатов (99,91%), поэтому нам очень сложно определить метки для изображений, которые не принадлежат ни к одному классу в наборе данных.</p>
	<p>6. Решение</p>
	<p>Чтобы решить эту проблему, мы применим функцию активации сигмовидной, а затем посмотрим на полученные результаты. Ниже приведены результаты модели, если к последнему слою применяется сигмовидная функция активации.</p>
	<p>[[2.7557e-05 0.014681 9.0419e-05 0.0017351 0.0022757 0.00075092 0.00022904 6.3055e-06 0.00012885 2.1713e-05 0.31547 0.0082597 0.00029327]]</p>
	<p>index max: 10</p>
	<p>Таким образом, наибольшее значение в слоях классификации по-прежнему находится в 10-м слое (это Собор Василия Блаженного), но полученное значение значительно меньше (0,31547). Помните, что это число не является процентом вероятности для всех классификационных классов.</p>
	<p>Поэтому мы можем установить пороговое значение, например 0,5. Если полученное максимальное значение больше 0,5, то мы можем предположить, что входное изображение принадлежит этому классу классификации, в противном случае мы можем заключить, что входное изображение не принадлежит ни одному классу классификации в наборе данных.</p>
	<p>[[2.7557e-05 0.014681 9.0419e-05 0.0017351 0.0022757 0.00075092 0.00022904 6.3055e-06 0.00012885 2.1713e-05 0.31547 0.0082597 0.00029327]]</p>
	<p>index max: 10</p>
	<p>label predict: Unknown</p>
	<fig id="F5">
		<label>Figure 5</label>
		<caption>
			<p>Изображение с контуром рамки обнаружения здания</p>
		</caption>
		<alt-text>Изображение с контуром рамки обнаружения здания</alt-text>
		<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="/media/images/2024-06-13/74000994-820d-4e16-94b2-5d149810db52.png"/>
	</fig>
	<p>7. Заключение</p>
	<p>В данной статье мы рассмотрели основы функций активации и их математические уравнения, сфокусировавшись на функциях softmax и сигмоиды. Функция активации играет важную роль в построении и обучении искусственных нейронных сетей, определяя их функциональные возможности. Мы изучили структуру и работу искусственного нейрона, а также принцип действия функций активации на примере сумматора.</p>
	<p>Сигмоидальная функция широко используется в задачах бинарной классификации, преобразуя входное значение в диапазон от 0 до 1. Функция softmax, в свою очередь, применяется в многоклассовой классификации, преобразуя вектор значений в вероятностное распределение.</p>
	<p>Однако, рассматривая конкретную проблему многоклассовой классификации зданий в городе Москве, мы обнаружили, что использование функции softmax может привести к ложным результатам, особенно когда входные данные не соответствуют ни одному классу в наборе данных. Это ставит под сомнение точность классификации и требует системного контроля и обработки таких случаев.</p>
	<p>В заключении мы предложили решение данной проблемы, заключающееся в применении функции активации сигмоиды и установлении порогового значения для определения принадлежности входного изображения к классам классификации. Этот подход позволяет более точно оценивать результаты классификации и избегать ложных выводов.</p>
</sec>
        <sec sec-type="supplementary-material">
            <title>Additional File</title>
            <p>The additional file for this article can be found as follows:</p>
            <supplementary-material id="S1" xmlns:xlink="http://www.w3.org/1999/xlink"
                                    xlink:href="https://doi.org/10.5334/cpsy.78.s1">
                <!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://research-journal.org/media/articles/12098.docx">12098.docx</inline-supplementary-material>]-->
                <!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://research-journal.org/media/articles/12098.pdf">12098.pdf</inline-supplementary-material>]-->
                <label>Online Supplementary Material</label>
                <caption>
                    <p>Further description of analytic pipeline and patient demographic information. DOI:
                        <italic>
                            <uri>https://doi.org/None</uri>
                        </italic>
                    </p>
                </caption>
            </supplementary-material>
        </sec>
    </body>
    <back>
        <ack>
            <title>Acknowledgements</title>
            <p>None</p>
        </ack>
        <sec>
            <title>Competing Interests</title>
            <p>None</p>
        </sec>
        <ref-list>
            <ref id="B1">
                    <label>1</label>
                    <mixed-citation publication-type="confproc">
                        Красненко Д.М. Нейронные сети. Описание функций активации нейросети / Д.М. Красненко, А.С. Помогаев, А.С, Штыленко // Приоритетные направления инновационной деятельности в промышленности. Сборник научных статей IV международной научной конференции. — Казань, 2021. — С. 74-76.
                    </mixed-citation>
                </ref><ref id="B2">
                    <label>2</label>
                    <mixed-citation publication-type="confproc">
                        Кобзев А.А. Анализ алгоритмов обучения нейронной сети / А.А., Кобзев, А.В. Лекарева, О.С. Сидорова // Современные наукоемкие технологии. — 2021. — № 6-1. — С. 23-28.
                    </mixed-citation>
                </ref><ref id="B3">
                    <label>3</label>
                    <mixed-citation publication-type="confproc">
                        Ерш К.А. Сигмоидная функция активации как фильтр информации / К.А. Ерш // Традиционная и инновационная наука: история, современное состояние, перспективы. Сборник статей Международной научно-практической конференции. — 2019. — С. 29-31
                    </mixed-citation>
                </ref><ref id="B4">
                    <label>4</label>
                    <mixed-citation publication-type="confproc">
                        Маршаков Д.В. Сравнение результатов нейросетевой классификации с применением SOFTMAX и функции расстояния / Д.В. Маршаков // Математические методы в технологиях и технике. — 2021. — № 8. — С. 75-78.
                    </mixed-citation>
                </ref><ref id="B5">
                    <label>5</label>
                    <mixed-citation publication-type="confproc">
                        Костерин М.А. Нейросетевая классификация русскоязычных предложений по тональности на четыре класса / М.А. Костерин, И.В. Парамонов // Моделирование и анализ информационных систем. — 2022. — Т. 29. — № 2. — С. 116-133.
                    </mixed-citation>
                </ref><ref id="B6">
                    <label>6</label>
                    <mixed-citation publication-type="confproc">
                        Building Moscow Image Dataset. // Building Moscow Image Dataset.. — 2024 — URL: https://universe.roboflow.com/thanhnq/building-moscow (дата обращения: 24.03.2024) [in English]
                    </mixed-citation>
                </ref><ref id="B7">
                    <label>7</label>
                    <mixed-citation publication-type="confproc">
                        Lin C. Transfer Learning Based Traffic Sign Recognition Using Inception-v3 Model / C. Lin, L. Li, W. Luo [et al.] // Periodica Polytechnica Transportation Engineering. — DOI: 10.3311/pptr.11480 
                    </mixed-citation>
                </ref><ref id="B8">
                    <label>8</label>
                    <mixed-citation publication-type="confproc">
                        Иванова К.М. История храма Спаса на Крови. Гуманитарные науки в современном вузе: вчера, сегодня, завтра / К.М. Иванова, Д.В. Логинова // Материалы V международной научной конференции. — Санкт-Петербург, 2022. — T. 2. — С. 901-904.
                    </mixed-citation>
                </ref><ref id="B9">
                    <label>9</label>
                    <mixed-citation publication-type="confproc">
                        Колобаев М.Е. Современные архитектуры сверточных нейронных сетей, применяемые для задач классификации изображений / М.Е. Колобаев, Д.А. Прытыка, Д.О. Михайлова [и др.] // Мягкие измерения и вычисления. — 2023. — Т. 69. — № 8. — С. 69-78.
                    </mixed-citation>
                </ref><ref id="B10">
                    <label>10</label>
                    <mixed-citation publication-type="confproc">
                        Хрипунов Д.Д. Сверточные нейронные сети как инструмент решения задачи классификации изображений / Д.Д. Хрипунов // Ломоносовские научные чтения студентов, аспирантов и молодых ученых - 2022. — Северный (Арктический) федеральный университет имени М.В. Ломоносова, 2022. — С. 597-600.
                    </mixed-citation>
                </ref>
        </ref-list>
    </back>
    <fundings>
        
    </fundings>
</article>