Markov processes in microcontroller selection problems
Markov processes in microcontroller selection problems
Abstract
The article proposes a probabilistic model for selecting a microcontroller for the design of modern embedded systems, based on the framework of absorbing Markov chains. Given the multicriteria nature of the problem, which includes such conflicting requirements as computing power, energy efficiency, cost, peripheral capabilities and level of support, the authors formalise the decision-making process as a stochastic transition between states, each of which corresponds to the consideration of a specific microcontroller. The final decision is modelled as an accepting state. The utility of each option is evaluated using a weighted sum of normalised technical and economic characteristics, while the transition probabilities and the probability of reaching the final state are determined via a softmax function with a rationality parameter. The model not only identifies the most preferred solution but also provides quantitative metrics: the probabilities of selecting alternatives, the expected decision-making time, and the stability of the result. The advantages of the approach — including the accounting of uncertainty and the dynamic interpretation of choice — are discussed, as well as its limitations related to the Markov assumption, sensitivity to normalisation and weights, and the stationarity of parameters. It has been demonstrated that the model complies with industry standards (in particular, GOST R 57957–2017) and can be extended through integration with machine learning methods, hidden Markov models, and embedding in CAD/EDA systems. The approach can be generalised to component selection tasks in robotics, the IoT and other areas of engineering design, providing a transparent, measurable and adaptive decision-making mechanism under conditions of uncertainty.
1. Введение
Проектирование современных встраиваемых систем требует комплексного подхода к выбору аппаратной платформы. Центральным элементом такой платформы является микроконтроллер — интегральная схема, объединяющая процессорное ядро, память и периферийные модули. При этом разработчик сталкивается с необходимостью балансировать противоречивые требования: высокая вычислительная мощность или низкое энергопотребление, богатая периферия или низкая стоимость, широкая экосистема или компактность , , .
Традиционные методы выбора, от экспертных оценок до таблиц сравнения, часто игнорируют динамическую природу проектирования: требования могут уточняться по ходу разработки, появляются новые ограничения, меняется доступность компонентов. Это делает актуальным применение вероятностных моделей принятия решений, способных учитывать неопределённость. Одним из инструментов для моделирования таких процессов являются марковские цепи — стохастические процессы без памяти, где будущее состояние зависит только от текущего , .
Анализ научно-технических публикаций демонстрирует устойчивый тренд на использование динамических моделей в проектировании встраиваемых систем. В работах , , обоснована эффективность многокритериального анализа, однако выявлена проблема «информационного шума» при равенстве весов. В исследованиях , , акцент смещается на интеграцию марковских процессов с методами машинного обучения для предсказания жизненного цикла архитектур.
В данной статье рассматривается процесс выбора микроконтроллера как поглощающую марковскую цепь, где каждое переходное состояние соответствует рассмотрению конкретного МК, а поглощающее — финальному решению. Разработка методики многокритериального выбора МК на базе марковских процессов обеспечит устойчивость решения к стохастической природе входного потока данных.
2. Постановка задачи формального выбора
Пусть задано конечное множество альтернатив M={M1, M2, …, Mn}, каждый из которых характеризуется вектором технических и экономических параметров pi
где fi — максимальная тактовая частота (МГц),
Ei — среднее энергопотребление в активном режиме (мА),
Ci — рыночная стоимость (руб.),
Ii ϵ[0,1] — степень совместимости с требуемой периферией (например, наличие UART, SPI, ADC, CAN и т.д.),
Si ϵ [0,1] — уровень поддержки разработчиков (наличие SDK, документации, сообщества).
Задача состоит в выборе оптимальной альтернативы M*ϵM, максимизирующей значение целевой функции полезности при заданных весах критериев.
Предлагаемый алгоритм включает следующие этапы:
Определение пространства состояний марковской цепи как
где Di — состояние, соответствующее окончательному выбору микроконтроллера Mi.
Такая структура позволяет явно моделировать финальное решение, а не просто «остановку». Общее число состояний марковского процесса – 2n .
2. Нормирование параметров. Для обеспечения сопоставимости критериев проводится линейная нормировка
Для минимизируемых параметров Ei, Ci используется обратная нормировка
, .3. Формирование функции полезности и ранжирование параметров микроконтроллеров в виде. Полезность микроконтроллера Mi определяется как взвешенная сумма нормированных характеристик
где веса ωk≥0, ∑ωk=1 и могут быть заданы экспертно, либо рассчитаны с помощью методов многокритериального анализа, таких как иерархический процесс Саати.
4. Процесс выбора заключается в вероятности перехода из состояния Mi в Mj (i≠j) и интерпретируется как «сравнение» и возможный «переход внимания» к другой альтернативе. Вероятность такого перехода задаётся через многопеременную логистическую функцию (softmax-функцию):
а вероятность завершения выбора в пользу Mi:
В (1) параметр α> 0 регулирует «рациональность» агента, при α→0 — все переходы равновероятны (случайный выбор), а при α→∞ — выбор всегда падает на альтернативу с максимальной Ui
.Марковский процесс характеризуется матрицей переходов P основываясь только на текущем состоянии, имеет размер 2n×2n и блочную форму:
где Q — матрица переходов между переходными состояниями размером n×n;
R — диагональная матрица поглощения размером n×n,
In — единичная матрица (поглощающие состояния не покидаются).
Фундаментальная матрица поглощающей цепи N принимает вид
Элемент этой матрицы Nij — это ожидаемое число посещений состояния Mj при старте из Mi до поглощения
.Вероятность поглощения описывается в виде матрицы вероятностей поглощения
Элемент Bij — это вероятность того, что процесс, начавшийся в Mi, завершится выбором Mj.
Если начальное распределение задано вектором π(0)=(π1, …, πn), то финальное распределение выбора:
5. Ожидаемое время принятия решения. Вектор ожидаемого числа шагов до поглощения имеет вид:
где 1n — вектор из единиц длины n.
Выбор микроконтроллера инженером зачастую выполняется субъективно. Эти факторы приводят к отклонениям от идеальной рациональности, выражающейся в абсолютном следовании принципу максимизации полезности. Использование вероятностного подхода позволяет учесть подобные отклонения посредством введения параметра иррациональности α. Чем меньше значение α, тем больше проявляется случайность в поведении инженера, отражающая реальные человеческие особенности принятия решений.
Распределения вероятностей переходов между состояниями могут быть выбраны различными способами. Наиболее распространённым является экспоненциальное распределение (функция softmax), которое широко применяется в моделях принятия решений и машинном обучении благодаря своей способности плавно переходить от равномерного распределения к детерминированному выбору при изменении параметра α.
Даже при сведении многокритериальной задачи к одному агрегированному показателю возникает проблема неопределённости вследствие вариативности индивидуальных предпочтений инженеров и нестабильности параметров микроконтроллеров. Различные инженеры могут иметь разные представления о важности тех или иных характеристик, что отражается в различиях назначаемых весов ωk. Даже при одинаковых весах различия в восприятии одних и тех же параметров, например, субъективная оценка уровня поддержки разработчика способны приводить к различным результатам выбора.
Кроме того, сами параметры микроконтроллеров подвержены колебаниям: энергопотребление зависит от режима эксплуатации, поддержка сообществом развивается неравномерно. Всё это создаёт дополнительную неопределённость, приводящую к невозможности однозначного выбора наилучшего варианта.
Интерпретация неопределённости возможна несколькими путями:
– статистическое усреднение как выбор варианта с наивысшей средней полезностью по множеству реализаций случайных параметров;
– робастный подход в процессе которого выбирается вариант, демонстрирующий наименьшую чувствительность к изменению параметров и весов.
– байесовский подход, где используются апостериорные распределения параметров и весов, обновляемые по мере поступления новых данных.
Количественные метрики, предоставляемые моделью, такие как вероятности выбора, среднее время принятия решения, дисперсия полезности, позволяют сравнивать альтернативы и выбирать наиболее устойчивый вариант.
Предложенная модель на основе поглощающей марковской цепи обладает рядом существенных преимуществ по сравнению с традиционными методами выбора микроконтроллеров:
– формализация неопределённости. В реальных условиях характеристики микроконтроллеров (например, энергопотребление в различных режимах) и предпочтения разработчика (веса критериев) редко известны точно. Модель допускает задание этих величин не как фиксированных чисел, а как вероятностных распределений (например, нормальных или бета-распределений). Это позволяет учитывать как производственные допуски, так и субъективную неопределённость при оценке важности критериев, что особенно важно в ранних стадиях проектирования
;– динамическая интерпретация процесса выбора. В отличие от статических методов (например, взвешенной суммы или анализа иерархий), предложенная модель рассматривает выбор не как мгновенное действие, а как последовательный когнитивный или алгоритмический процесс. На каждом шаге система «размышляет»: либо остановиться на текущем варианте, либо перейти к рассмотрению другого. Такая интерпретация ближе к реальному поведению инженера и позволяет анализировать траекторию принятия решения, а не только его финальный результат;
– наличие количественных метрик для анализа качества выбора. Модель предоставляет не только финальное распределение вероятностей выбора, но и дополнительные аналитические инструменты:
– ожидаемое время принятия решения (среднее число шагов до «остановки»), что полезно для оценки сложности задачи;
– матрицу вероятностей поглощения, позволяющую оценить устойчивость решения к начальным условиям;
– чувствительность результата к изменениям параметров (через производные по α или весам).
Эти метрики делают процесс выбора прозрачным и измеримым, а не интуитивным или субъективным
.Несмотря на преимущества, предложенная модель имеет определённые ограничения, требующие внимания при практическом применении:
– предположение марковости. Основное допущение — это то, что будущее состояние зависит только от текущего, а не от истории предыдущих сравнений. В реальности инженер может запоминать сложные взаимосвязи между критериями (например, «если частота высокая, то энергопотребление обязательно растёт»), что нарушает условие «отсутствия памяти». В таких случаях модель может давать неточные оценки вероятностей перехода;
– зависимость от качества нормировки и задания весов. Результат модели чувствителен к способу приведения разнородных параметров к единой шкале, а также к выбору весовых коэффициентов. Некорректная нормировка (например, игнорирование нелинейности шкалы) или субъективно завышенный вес одного критерия могут исказить финальное решение. Поэтому важно использовать обоснованные методы многокритериального анализа для определения весов;
– стационарность параметров. В базовой версии модели характеристики микроконтроллеров и их доступность считаются неизменными во времени. Однако в реальных условиях цена может колебаться, поставки – задерживаться, а новые модели — появляться на рынке. Хотя модель теоретически допускает расширение до неоднородных марковских цепей (где матрица переходов зависит от времени), это требует дополнительной сложности в реализации.
Проектирование встраиваемых систем должно соответствовать установленным стандартам, которые определяют базовые принципы разработки, включая надёжность, безопасность и документирование
. Хотя данная модель не противоречит стандарту, её внедрение в регламентированные процессы требует дополнительной верификации и интеграции в существующие жизненные циклы разработки.3. Перспективы развития
Модель открывает широкие возможности для дальнейшего развития и интеграции в инженерные практики. Марковские цепи являются хорошо изученным классом стохастических процессов, для которых разработан мощный математический аппарат. Их свойства подробно описаны как в классических работах, так и в современных учебниках по вероятностному моделированию и теории случайных процессов. Это обеспечивает надёжность и строгость предлагаемого подхода.
Интеграция с методами машинного обучения заключается в автоматическом обучении на основе исторических данных, например, по набору ранее принятых решений в аналогичных проектах, значений весов критериев и даже функция полезности может быть задана не вручную. Это позволит персонализировать модель под конкретную команду или организацию.
Использование марковских процессов для данной задачи позволит сделать расширение до скрытых марковских моделей (НMM). В ситуациях, когда часть характеристик микроконтроллеров недоступна или зашумлена (например, реальное энергопотребление известно лишь приблизительно), можно использовать HMM, где наблюдаемые данные (например, тестовые замеры) связаны со скрытыми состояниями (истинными параметрами). Это повысит робастность модели в условиях неполной информации.
Предложенная модель может быть реализована как модуль в современных системах автоматизированного проектирования (CAD) или проектирования электроники (EDA). Такой модуль мог бы автоматически предлагать кандидатов на роль микроконтроллера, оценивать риски выбора и даже имитировать альтернативные сценарии разработки, ускоряя итерационный процесс проектирования.
4. Заключение
Предложенная марковская модель предоставляет строгий, количественный и гибкий математический аппарат для решения задачи выбора микроконтроллера в условиях многокритериальности, неопределённости и динамически уточняющихся требований. В отличие от эвристических или статических подходов, она не только указывает на наиболее вероятный оптимальный вариант, но и позволяет оценить надёжность, устойчивость и ожидаемую длительность процесса принятия решения. Благодаря своей обобщённой структуре, подход может быть адаптирован для выбора других компонентов — датчиков, микросхем памяти, аккумуляторов — и применён в таких областях, как встраиваемая электроника, робототехника, промышленный IoT и киберфизические системы. При этом его можно развивать в направлении большей адаптивности, интеграции с данными и соответствия отраслевым стандартам, что делает его перспективным инструментом для инженерной практики будущего.
