The Problem of Evaluating the Effectiveness of the Miller-Rabin Primality Test

Zhumaniezov A. R.

doi:10.23670/IRJ.2023.131.1

The Problem of Evaluating the Effectiveness of the Miller-Rabin Primality Test

Research article

DOI:

https://doi.org/10.23670/IRJ.2023.131.1

Issue: № 5 (131), 2023

Suggested:

25.07.2022

Accepted:

10.04.2023

Published:

17.05.2023

964

3

XML

PDF

Abstract

This work analyses the efficiency of the Miller-Rabin test. As a starting point for the analysis, the algorithm for finding a sequence of ψn numbers was chosen. Within this algorithm, a "bottle-neck" was detected and a way to solve it was presented. It turned out to be the memory consumption.

The main idea is the distribution of pseudoprime numbers over bin(ordp(ai)) values. It is concluded that the distribution is uneven and there is a strong bias towards smaller values of bin(ordp(ai)). For clarity, all reasoning and experimental results are accompanied by graphs.

Thanks to the data obtained, it was concluded that it is possible to divide the whole set of pseudoprime numbers into subsets by the value of bin(ordp(ai)). Thus, the final algorithm is produced, in which the memory consumption is optimized compared to the original algorithm.

Keywords:

Miller-Rabin primality test, pseudoprime numbers, probability theory.

1. Введение

Современная криптография, а особенно её защищённость, основывается на различных свойствах простых чисел. Поэтому возникает необходимость в эффективном поиске достаточно больших простых чисел. Существует множество различных подходов для решения данной проблемы. Однако наиболее известным и эффективным является использование теста Миллера-Рабина.

Таким образом, актуальность работы обеспечивается использованием простых чисел в современных исследованиях. Например, в статьях

и представлен новый протокол маршрутизации, основанный на простых числах, позволяющий обнаруживать кротовые норы в мобильных сетях. Также в статьях , и представлен алгоритм шифрования, основанный на простых числах и биометрии, а также его применение в технологии блокчейна, а также его использование в интернете вещей. А в статье представлен алгоритм шифрования изображений, использующий множество простых чисел и полярное разложение.

Основной целью является исследование эффективности работы теста Миллера-Рабина и распределения его ошибки. Для достижения поставленной цели были сформулированы и решены следующие задачи:

1. Анализ существующих методов оценки эффективности теста Миллера-Рабина.

2. Анализ возможных оптимизаций для существующего метода оценки эффективности теста Миллера-Рабина.

Тест Миллера-Рабина

, является вероятностным тестом. Это означает, что тест может выносить ошибочный вердикт, но с очень маленькой вероятностью. В настоящий момент известна только верхняя граница для её значения, однако она сильно завышена.

Есть и другой подход к оценке эффективности алгоритма – последовательность чисел – наименьшее строго псевдопростое число для n первых простых чисел. Главная сложность этого подхода – быстрый рост значение и отсутствие эффективных непереборных алгоритмов.

Таким образом, имея достаточно точную информацию об эффективности теста Миллера-Рабина, можно на его основе создавать модификации и получать достаточно точные асимптотики времени выполнения и памяти.

К примеру, К. Нари, Е. Оздемир и Н. А. Озкирисци представили алгоритм

, добавляющий дополнительные проверки после запуска теста Миллера-Рабина с основанием 2. Также Д. Соренсон и Д. Вебстер разработали алгоритм по поиску наборов простых чисел по заданному паттерну . Для построения оценки эффективности они используют знания о распределении строго псевдопростых чисел.

2. Методы и принципы исследования

Тест Миллера-Рабина – вероятностный тест, представленный сперва Г. Миллером в 1976 г.

, затем улучшенным М. О. Рабиным в 1980 . Основан этот тест на модификации теоремы Эйлера .

Для упрощения дальнейшего описания теорем и алгоритмов введём следующие функции:

Определение 1. Пусть n – произвольное натуральное число, представимое следующий вид:

(1)

Тогда функции bin(n) и odd(n) определяются следующим образом:

(2)

Тогда каждая итерация теста Миллера-Рабина заключается в выборе произвольного основания и проверки выполнимости следующих условий:

(3)

Если одно из условий выполнилось, то число a называется свидетелем простоты числа n, а само число считается прошедшим текущую итерацию теста.

Первый подход к оценке эффективности алгоритма основан на вычислении количества свидетелей простоты произвольного числа. Все вычисления, производимые в рамках данного подхода основаны на следующей теореме

:

Теорема 1. Пусть n – произвольное натуральное число, представимое следующий вид:

(4)

Тогда выполняются все перечисленные условия:

(5)

Где за ordk(a) обозначают порядок числа a по модулю k.

Обозначим за W(n) – количество свидетелей простоты. Ш.Т. Ишмухаметов, Б.Г. Мубараков и Р.Г. Рубцова представили конечную формулу

для расчёта функции W(n) для случая полупростого n=p*q:

(6)

Однако позже Б. Г. Мубараков получил формулу

для произвольного числа n по его разложению на простые множители

:

(7)

Следующим шагом для оценки эффективности вводится функция Fr(n) – вероятность выбора свидетеля простоты. Поскольку из условий (3) следует, что НОД (a, n)=1, то значение функции будет вычисляться по следующей формуле:

(8)

М.О. Рабин доказал, что ¼ – верхняя граница

для Fr(n). Однако данное значение достигается для бесконечного количества чисел n, что значительно усложняет анализ этой функции.

Поэтому оценки вычислялись для среднего значения вероятности на отрезке Avg(Fr(n)). Первая оценка

для этой функции была получена Б.Г. Мубараковым, но ограничиваясь только полупростыми числами n=p*q при фиксированном p:

(9)

Однако данная оценка была сильно завышена, поэтому Б.Г. Мубараков представил улучшение оценки, но для случая p=2*p', где p' – простое число. Для этой цели рассматривались два возможных случая отношений p и q:

1. q=(p-1)k+1 → в этом случае верхняя оценка из (5) становится асимптотикой функции

.

2. q=2k+1, где 2k mod (p-1) ≠ 0 → в этом случае верхняя оценка из (5) улучшается до следующей

:

(10)

Наконец, посчитав математическое ожидание от обоих вариантов получаем результат

:

(11)

После чего было высказано предположение, что для всех значений p оценка будет принимать следующий вид

:

(12)

Где коэффициент находится на отрезке .

Также были получены результаты

для трёхпростых чисел

. Первая оценка была получена для фиксированных

и

:

(13)

Однако эта оценка также является сильно завышенной и требует улучшения. Одним из возможных способов разбиение всех чисел на группы, расчёт оценки для каждой группы и расчёт общего значения через математическое ожидание.

На настоящий момент получены оценки для двух классов:

1. Трёхпростое число, при фиксированном и , удовлетворяющих следующим условиям:

(14)

Итоговая оценка для такой ситуации

, :

(15)

2. Трёхпростое число, при фиксированном p и q, удовлетворяющих следующим условиям:

(16)

Итоговая оценка для такой ситуации

:

(17)

Второй подход к оценке эффективности основан на свойствах функции

определённой следующим образом:

(18)

Теперь укажем теорему, на которой построена другая оценка:

Теорема 2. Пусть произвольное число, представимое в виде , где – простое. Тогда для того, чтобы было строго псевдопростым по базе необходима делимость на .

Используя теорему 2 и оценки количества делителей, мы получаем верхнюю оценку

для ошибки теста Миллера-Рабина, но только для полупростых чисел:

(19)

Однако реальные значения не достигают верхней оценки. Значит эту оценку можно улучшить.

Третий подход к оценке эффективности – вычисление последовательности чисел – наименьшее строго псевдопростое число для первых простых чисел. Ж. Женхианг смог получить кандидатов

для значений первых 19 элементов последовательности. До настоящего времени смогли доказать эту гипотезу только для первых 13 элементов последовательности.

Рассматривая уже полученные результаты, можно сделать вывод о том, что последовательность очень быстро возрастает. Однако эффективный алгоритм поиска очередного алгоритма пока не найден, поэтому поиск следующего элемента последовательности затруднителен.

Наиболее оптимальный переборный алгоритм

, который использовался для поиска последних известных элементов последовательности основан на Теореме 2 и следующих утверждениях:

Утверждение 1. Если для произвольных простых чисел и выполняется и , то .

Утверждение 2. Если для произвольных простых чисел и выполняется и , то .

Сам алгоритм состоит из двух методов, каждый из которых выполняет перебор возможных кандидатов по своим критериям.

Первый метод использует НОД для получения всех кандидатов. На вход метод получает число . В ходе алгоритма вычисляются все для всех оснований . Затем вычисляется НОД полученных значений. получаются путём перебора всех делителей НОД. Второй метод используя утверждения 1 и 2 перебирает все возможные остатки по достаточно большому модулю. После чего получаются перебором всех простых чисел с заданным остатком по модулю.

Поскольку первый метод эффективней на маленьких числах, а второй метод на больших, то первый метод применяется для всех , где – верхняя граница отрезка на котором производится поиск, а второй метод для остальных . Значение границы для методов было получено теоретическим путём для наиболее оптимального раздела.

Также для быстрого перебора используется хэш-таблица в которой хранятся все простые числа и значения для всех оснований . В качестве ключа используется хеш-значения от значений . Поскольку все значения из хэш-таблицы используются для формирования составных чисел, состоящих не менее чем из 3 делителей, то и хранить достаточно лишь все простые числа .

Таким образом итоговый алгоритм получается следующий:

Algorithm 1.

– хэш-таблица, – граница для перебора, – набор оснований.

Перебираем все простые числа от до :

Вычисляем все .

Получаем список всех простых чисел из с совпадающими значениями .

Формируем все возможные значения :

Если , то перебираем всех кандидатов на строго псевдопростоту с помощью первого метода.

Иначе, с помощью второго.

Если , то добавляем в вместе со всеми значениями .

3. Основные результаты

Поскольку последовательность чисел растёт достаточно быстро, то рассматриваемые границы для поиска также будут сильно увеличиваться. Это приведёт не только к замедлению времени работы, но и увеличению объёма используемой памяти. Например, , следовательно, в хэш-таблице будет храниться порядка элементов, что крайне много для хранения на компьютере. Поэтому необходимо модифицировать алгоритм 1, чтобы он затрагивал меньше памяти.

Для начала рассмотрим распределение простых чисел на отрезке по значению . Для ускорения вычисления мы введём следующую функцию:

Определение 1. Пусть и – произвольные числа, – простое, a определяется следующим образом:

(20)

Тогда функция , определяется следующим образом:

(21)

Эффективный поиск значения этой функции выполняется следующим алгоритмом:

Алгоритм 2.

– простое, – натуральное числа,

Посчитаем

Пока не станет равным 1 выполняем:

Значение устанавливается результатом функции

Вычислительная сложность данного алгоритма .

Для использования данного алгоритма докажем следующую теорему:

Теорема 3. Пусть произвольное число, тогда выполняется следующее соотношение:

(22)

Доказательство. Пусть . Тогда возможно 2 варианта:

1. .

→ найден неверно.

2. .

– целое

→ найден неверно.

Значит остаётся единственный вариант в (21).

Таким образом, заменив вычисление на , мы получим тот же результат, но за меньшее время.

4. Обсуждение

После получения распределения простых чисел на отрезке

по значениям

видно, что основная часть простых чисел имеет очень маленькое значение (см. рисунки 1, 2).

Рисунок 1 - Распределение простых чисел по значениям для основания 7

Рисунок 2 - Распределение простых чисел по значениям для основания 19

Также можно заметить, что количество простых чисел падает примерно в 2 раза, пока не приблизится к крайне малым значениям (см. рисунок. 3).

Рисунок 3 - Отношение количеств простых чисел на соседних значениях

Из-за столь большой скорости падения количества более 90% простых чисел имеет значение

не более 4 (см. рисунок. 4).

Рисунок 4 - Процент оставшегося количества чисел

Также можно заметить, что при оценке распределения

по нескольким значениям

оказывается, что при меньших границах количество увеличивается, а при больших уменьшается (см. рисунок. 5).

Рисунок 5 - Процент оставшегося количества чисел

Таким образом, можно сделать вывод о необходимости разбиения алгоритма на 2 этапа:

1 этап – перебрать все простые числа со значением всех меньше заданного порогового значения с помощью алгоритма 2. При этом само значение перебирать из некоторого фиксированного набора .

2 этап – перебрать все простые числа со значением хотя бы одного не меньше с помощью другого, возможно менее эффективного для большого количества чисел, алгоритма.

Пример такого алгоритма:

Алгоритм 3.

– список простых чисел, – список контейнеров для простых чисел

Перебираем все основания :

Очищаем все контейнеры в

Перебираем все числа из :

Вычисляем

Переносим из в

Переносим последовательно все простые числа из контейнеров в

Вычислительная сложность данного алгоритма

5. Заключение

В рамках данной работы были представлены текущие результаты по оценке эффективности теста Миллера-Рабина. Было продемонстрировано три разных подхода, сделаны выводы о возможном направлении для каждого подхода. Для модификации был выбран третий подход – поиск последовательности чисел – наименьшее строго псевдопростое число для первых простых чисел.

Было обнаружено «бутылочное горлышко» для исходного алгоритма – им оказался расход памяти на хэш-таблицу. Поэтому дальнейшие исследования направлены на оптимизацию расхода памяти.

Были сделаны выводы о распределении простых чисел по значениям и рассмотрен вариант использования полученных данных для модификации алгоритма.

Была представлена новая схема алгоритма со сравнимым временем работы, но уменьшенным расходом памяти.

Additional materials

Not specified

Financing

Institute of Computational Mathematics and Information Technologies, Kazan (Volga Region) Federal University
The work was supported by the Strategic Academic Leadership Program of the Kazan (Volga Region) Federal University ("PRIORITET-2030").

Acknowledgements

Not specified

Conflicts of interests

Not specified

References

Muruganandam S.. A Survey: Comparative Study of Security Methods and Trust Manage Solutions in MANET / S. Muruganandam, J. Renjit, R. Kumar; — Chennai: IEEE, 2019. — p. 125-131.
Sharma S.. EPPN: Extended Prime Product Number based wormhole DETECTION scheme for MANETs / S. Sharma, R. M. Sharma; — Coimbatore: IEEE, 2017. — p. 251-254.
Iovane G.. A Novel Blockchain Scheme Combining Prime Numbers and Iris for Encrypting Coding / G. Iovane, M. Nappi, M. Chinnici, A. Petrosino, A. Castiglione, S. Barra; — Fukuoka: IEEE, 2019. — p. 609-618.
Iovane G.. Blockchain-Based Iris Authentication in Order to Secure IoT Access and Digital Money Spending / G. Iovane, A. Rapuano, P. Di Gironimo; — Issue 12665. — Berlin: Springer, 2021. — p. 427-441.
Maddalena L. Pattern Recognition and beyond: Alfredo Petrosino’s Scientific Results / L. Maddalena, M. Gori, S. K. Pal // Pattern Recognition Letters. — 2020. — 138. — p. 659–669.
Singh S. P.. A Secure Image Encryption Algorithm Based on Polar Decomposition / S. P. Singh, G. Bhatnagar, D. K. Gurjar; — Penang: IEEE, 2018. — p. 135-139.
Miller G. Riemann’s Hypothesis and Tests for Primality / G. Miller // Journal of Computer and System Sciences. — 1976. — 13. — p. 300-317.
Rabin M. O. Probabilistic Algorithm for Testing Primality / M. O. Rabin // Journal of Number Theory. — 1980. — 12. — p. 128-138.
Nari K. Strong Pseudo Primes to Base 2 / K. Nari, E. Ozdemir, N. A. Ozkirisci. — 2019 — URL: https://arxiv.org/abs/1905.06447 (accessed: 25.03.2023)
Sorenson P. J. Two Algorithms to Find Primes in Patterns / P. J. Sorenson, J. Webster. — 2019 — URL: https://arxiv.org/abs/1807.08777 (accessed: 25.03.2023)
Ribenboim P. The New Book of Prime Number Records / P. Ribenboim — New York: Springer, 1995. — 541 p.
Ishmukhametov S. T. On the Number of Witnesses in the Miller–Rabin Primality Test / S. T. Ishmukhametov, B. G. Mubarakov // Symmetry. — 2020. — 12.
Mubarakov B.G. Effektivnaya otsenka testa prostoti Millera-Rabina naturalnikh chisel [Efficient Evaluation of the Miller-Rabin Primality Test of Natural Numbers] / B.G. Mubarakov // Materials of the XIX All-Russian Youth Scientific School-Conference; — Issue 59. — Kazan, 2020. — p. 106-109. [in Russian]
Mubarakov B. G. On the Number of Primality Witnesses of Composite Integers / B. G. Mubarakov // Russian Mathematics. — 2021. — 65. — p. 73-77.
Zhumaniezov A. R.. The Problem of Error Frequency Distribution in the Miller-Rabin Test For Tripleprime Numbers / A. R. Zhumaniezov; — Issue 12. — Zurich: AIRCC Publishing Corporation, 2022.
Zhumaniezov A. R. Estimating the Distribution of Witnesses of the Primality of the Miller-Rabin Test / A. R. Zhumaniezov // International Journal on Computational Science & Applications. — 2022. — 12.
Bleichenbacher D. Efficiency and Security of Cryptosystems Based on Number Theory : dis....of PhD in Engineering : - : defense of the thesis 1996-01-01 : approved 1996-01-01 / D. Bleichenbacher — Zurich: 1996.— 98 p.
Zhumaniezov A. R.. Otsenka verojatnosti oshibki testa Millera-Rabina na poluprostyh chislah [Estimating the Probability of an Error in the Miller-Rabin Test on Semiprime Numbers] / A. R. Zhumaniezov // Proceedings of the International Youth Scientific Forum "LOMONOSOV-2022"; — Moscow: MAKS Press, 2022. [in Russian]
Zhang Z. Two Kinds of Strong Pseudoprimes up to 10^36 / Z. Zhang // Mathematics of Computation. — 2007. — 76. — p. 2095-2107.
Sorenson J. Strong Pseudoprimes to Twelve Prime Bases / J. Sorenson, J. Webster // Mathematics of Computation. — 2015. — 86. — p. 985-1003.

Review

All articles are peer-reviewed. But the reviewer or the author of the article chose not to publish a review of this article in the public domain. The review can be provided to the competent authorities upon request.

Author information

Affiliation:Kazan Federal University, Kazan, Russian Federation

Role:Writing, reviewing and editing, Draft writing and preparation, Visualization, Approbation, Management, Software, Resources, Project administrator, Methodology, Analysis, Funding, Research data analysis, Data curation, Conceptualization, Author

ORCID:0000-0002-6770-2184

Article metrics

Downloads:3

ViewsDownloads

Views

Total: