СПОСОБ ПОВЫШЕНИЯ ТОЧНОСТИ ОПРЕДЕЛЕНИЯ ИСЧИСЛЕННЫХ ДАННЫХ

Научная статья
Выпуск: № 1 (20), 2014
Опубликована:
2014/02/08
PDF

Асадуллин Э.З.

Кандидат технических наук, доцент, Казанский кооперативный институт

СПОСОБ ПОВЫШЕНИЯ ТОЧНОСТИ ОПРЕДЕЛЕНИЯ ИСЧИСЛЕННЫХ ДАННЫХ

Аннотация

На основе ряда фактов было сделано предположение о возможности повышения точности определения данных для расчетов на основе комплексного учета условий измерений, были намечены основные пути решения этой задачи. Гипотеза проводимого исследования, как и все гипотезы, в силу своего вероятностного характера требует проверки, доказательства. В настоящей статье рассматривается порядок проверки общей гипотезы исследования о повышении точности определения исчисленных данных для расчетов на основе комплексного учета условий измерений.

Ключевые слова: комплексный учет, дисперсия, математическое ожидание, математическая модель, методы регрессионного анализа.

Asadullin E.Z.

A candidate of technical sciences, associate professor, Kazan cooperative Institute

MODE OF THE RAISE OF ACCURACY OF DEFINITION OF THE CALCULATED DATA

Abstract

On the basis of a series of the facts the supposition about a possibility of a raise of accuracy of definition of the data for calculations on the basis of the complex account of conditions of measurements has been made, the basic ways of a solution of this problem have been planned. The hypothesis of conducted research, as well as all hypotheses, owing to the probability character demands check, the proof. In the present article the procedure for test of the general hypothesis of research about a raise of accuracy of definition of the calculated data for calculations on the basis of the complex account of conditions of measurements is considered.

Keywords: complex accounting, dispersion, the variance of mathematical expectation, mathematical model, methods of regression analysis.

  1. Случай равноточных измерений

Имеется п независимых измерений случайной величин (СВ) с одинаковой точностью. Измерения производятся в одинаковых условиях одним и тем же прибором. От опыта к опыту математическое ожидание и дисперсия СВ не изменяются, т.е.:

06-08-2018 10-40-00   (1)

В качестве оценки для математического ожидания СВ Х принимается среднее арифметическое значений, т.е.: 06-08-2018 10-45-00  (2) Рассеивание оценки 06-08-2018 10-46-13 характеризуется ее дисперсией: 06-08-2018 10-46-20  (3) Таким образом: 06-08-2018 10-51-53   (4)

С увеличением числа измерений рассеивание оценки математического ожидания СВ уменьшается.

  1. Случай неравноточных измерений

Производится п измерений случайной величин (СВ) с различной точностью (различные приборы или условия). От опыта к опыту математическое ожидание остается постоянным, а дисперсия СВ изменяются, т.е.:

06-08-2018 10-53-13  (5)

Так как измерения неравноточные, то в качестве оценки математического ожидания целесообразно взять среднее взвешенное с учетом точности каждого измерения. Оценка будет несмещенной, состоятельной и эффективной, если «вес» каждого измерения будет обратно пропорционален дисперсии. Тогда:

06-08-2018 10-56-54  (6)

Дисперсия оценки математического ожидания определяется по формуле:

06-08-2018 10-58-03  (7)

Таким образом, дисперсию и среднеквадратическое отклонение оценки математического ожидания определяются по формулам:

06-08-2018 11-05-36   (8)

Необходимо найти наилучшее приближенное значение X* величины. Для расчета применяется следующее соотношение:

06-08-2018 11-05-46    (9) Оценка X* является несмещенной и обладает минимальной дисперсией: 06-08-2018 11-06-04    (10) После преобразования дисперсии в срединные отклонения получается выражение: 06-08-2018 11-08-03   (11)

С увеличением числа неравноточных измерений рассеивание оценки математического ожидания СВ, также, как и при равноточных измерениях, уменьшается [1, 2, 3, 4].

Использование данного метода при выполнении мероприятий подготовки измерений в соответствии с выражениями (10, 11) позволяет более точно учитывать условия измерений и добиться повышения точности определения данных.

  1. Применение методов математического моделирования для воспроизведения условий определения исчисленных данных

Характеристики условий измерений воспроизводились на специально созданной для их изучения математической модели. Для исследования процесса определения исчисленных данных при различных условиях измерений и выработки рекомендаций применен опытно-теоретический метод. Расчеты, полученные при теоретическом методе оценки эффективности, проверялись в ходе реальных полевых измерений.

При теоретическом методе применялись точный способ ‑ статистических испытаний и приближенный – графический. Моделирование случайных величин осуществлялось путем преобразования независимых значений случайного числа, распределенного равномерно в интервале (0…1). Последовательность частных значений случайного числа получена на ЭВМ с помощью датчика-генератора случайных чисел.

Для нахождения закона распределения СВ необходимо располагать достаточно обширным статистическим материалом, порядка несколько сотен опытов. Однако на практике приходится иметь дело со статистическим материалом ограниченного объема – два-три десятка наблюдений, часто даже меньше. Это связано с дороговизной и сложностью каждого опыта. В исследуемой задаче вид закона распределения случайной величины – ошибки измерения, известен заранее – нормальный закон распределения [1, 2, 5], (в нашем случае это даже несущественно), требуется найти ее числовые характеристики. Для этого нет необходимости проводить неограниченное количество опытов.

Если число опытов п невелико, то замена математического ожидания средним арифметическим приводит к какой-то ошибке. Значение искомого параметра, вычисленное на основе ограниченного числа опытов, всегда будет содержать элемент случайности. Такое приближенное значение называется оценкой параметра 06-08-2018 11-09-28. Любая оценка, вычисляемая на основе наблюдаемых СВ представляет собой функцию величин Х1, Х2,…, Хп и сама является величиной случайной

06-08-2018 11-16-00   (12)

Нахождение статистических оценок 06-08-2018 11-09-28 параметров законов распределения в данном исследовании проводилось с помощью моментов эмпирического распределения, которые являются состоятельными оценками соответствующих моментов теоретического распределения.

Эмпирический начальный момент k-го порядка для дискретной СВ определяется равенством:

06-08-2018 11-17-12  (13)

где xi – значения СВ Х; рi ‑ соответствующие вероятности. Начальный момент первого порядка есть ни что иное, как математическое ожидание СВ: 06-08-2018 11-24-12   (14) Оценкой математического ожидания 06-08-2018 11-32-04 СВ Х является среднее арифметическое ее наблюдаемых значений: 06-08-2018 11-32-14   (15)

Оценка 06-08-2018 11-09-28 должна отвечать следующим требованиям: быть состоятельной, несмещенной, эффективной и обладать минимальной дисперсией.

Требование состоятельности оценки 06-08-2018 11-09-28 сводится к тому, чтобы при увеличении числа опытов п, она приближалась (сходилась по вероятности) к искомому параметру а (06-08-2018 11-42-08). Оценка математического ожидания mx СВ Х при увеличении числа опытов п, согласно закона больших чисел, сходится по вероятности к математическому ожиданию m СВ Х (06-08-2018 11-43-01).

Оценка для дисперсии 06-08-2018 11-48-50 при небольшом числе опытов (п≤40…50, в проведенном исследовании п=30) не может быть приравнена к статистической дисперсии 06-08-2018 11-49-27 . В этом случае возникает систематическая ошибка, чтобы ее исправить достаточно, ввести коэффициент 06-08-2018 11-49-36 и тогда:

06-08-2018 11-51-32   (16)

Выбранная несмещенная оценка 06-08-2018 11-09-28, должна быть как можно менее случайной, т.е. обладать минимальной дисперсией по сравнению с другими оценками: 06-08-2018 11-52-57   (17) Степень близости статистической оценки 06-08-2018 11-09-28 к ее характеристике, а теоретического распределения может быть определена с помощью равенства: 06-08-2018 11-53-52   (18)

которое означает: вероятность того, что случайный интервал (06-08-2018 12-00-26) содержит в себе достоверную, но неизвестную характеристику а, равную γ. Вероятность γ называется доверительной вероятностью, а интервал (06-08-2018 12-00-26) – доверительным интервалом.

Вероятность γ характеризует надежность статистической оценки 06-08-2018 11-09-28. В том случае, если а1 и а2 равны по абсолютной величине и противоположны по знаку, то можно говорить о точности статистической оценки:

06-08-2018 12-02-41    (19)

В настоящем исследовании для оценки доверительного интервала задана доверительная вероятность или надежность 95 % (0,95) [1, 2].

Коэффициенты корреляции 06-08-2018 12-03-28, между ошибками измерения дальности и направления по реперной точке и предмету близки к 1, т.е. рассеяние экспериментальных точек малое, а протяженность поля точек достаточно большое. Поэтому для усреднения несовместных решений системы уравнений применялся один из методов регрессионного анализа – метод наименьших квадратов (МНК). Этот метод реализован в математическом аппарате ЭВМ. Решение задачи, получаемое МНК по экспериментальным точкам, содержащим случайные ошибки, само также случайно, но благодаря усреднению многократных расчетов оно становится более определенным, более устойчивым.

При анализе области разброса исходных экспериментальных данных во внимание принимались ошибки способов определения исчисленных данных, неадекватность принятых вариантов решения задачи, а также учитывалась невоспроизводимость от опыта к опыту, или диффузность исследуемого процесса.

Разброс исходных данных складывается из трех составляющих: σДиф. – диффузности условий измерений, σВар. – ошибки адекватности принятых вариантов, σСп. ‑ ошибки способов измерений. Эти составляющие можно считать некоррелированными, тогда:

06-08-2018 12-04-23   (20)

Для упрощения, принято условие, что варианты решения задачи адекватны (σВар.<< σДиф. и σВар. << σСп), и тогда, размером σВар можно пренебречь. В этом случае, при уменьшении ошибок способов измерений (величиной σСп можно пренебречь) результирующий разброс исходных данных будет определяться только диффузностью условий измерений. Для усреднения разброса необходимо провести большое количество опытов, что требует увеличение затрат времени. Если же в этих условиях принять менее точные способы измерений, до тех пор, пока σСп<σДиф/3, погрешность обработки останется неизменной, а эффективность эксперимента повысится, за счет уменьшения затрат времени.

Таким образом, при σСп.<<σДиф. точность определения данных не может быть значительно повышена, за счет более точных способов измерений. Единственный путь повышения точности – статистическая обработка многократных отсчетов.

В качестве условия принято следующее утверждение – для обеспечения наибольшей эффективности эксперимента нет смысла уменьшать ошибку способа определения установок больше чем до σСп.<σДиф./3, и увеличивать объем выборки (количество опытов) до тех пор, пока величина 06-08-2018 12-05-56 не будет сопоставима с погрешностью адекватности принятых вариантов или систематической составляющей ошибки способа определения установок.

При рассмотрении вопроса о повышении точности путем статистического усреднения полагают, что точность с увеличением числа п усредняемых значений возрастает, как 06-08-2018 12-11-00, потому что 06-08-2018 12-11-09. Это справедливо лишь при полном отсутствии систематических погрешностей и абсолютной независимости значений между собой, т.е. при полном отсутствии их взаимной корреляционной связи. Очевидно, что у каждого из способов измерений есть свои систематические ошибки и многие способы зависят друг от друга. Следовательно, повышение точности, в соответствии с соотношением 06-08-2018 12-11-55, будет происходить лишь в ограниченном диапазоне значений числа п усредняемых значений [4].

Для того чтобы компенсировать влияние существующих корреляционных связей, при планировании и проведении эксперимента необходимо учесть возможно более полно различные условия измерений, т.е. варианты условий для проведения эксперимента должны быть адекватны (тождественны) реальным условиям полевых измерений.

При проведении математического моделирования условий измерений и определения установок для измерений использовался метод имитационного моделирования.

В данном исследовании проводится активный имитационный эксперимент с использованием, как эмпирических зависимостей, так и математических описаний. Цель планирования эксперимента – получение максимального объема информации об исследуемой системе в каждом эксперименте.

Спланирован полный факторный эксперимент вида 2 k (ПФЭ2k), где k=2.

Составлено уравнение вида:

06-08-2018 12-13-02  (21)

Общее число различных комбинаций уровней в ПФЭ для K факторов можно вычислить как: 06-08-2018 12-13-58  (22)

При проведении эксперимента была исследована зависимость между срединными ошибками по дальности и по направлению для следующих вариантов:

  • когда в расчет принимаются коррелированные поправки и,
  • когда эти поправки не учитываются.

Срединные ошибки способов РИ и НРИ (УС) при учете коррелированных поправок: по дальности составляют ЕХ=(0,32…0,74) %Д, по направлению Е=(1,60…2,97) ед. изм. углов; соответственно, без учета коррелированных поправок ‑ ЕХ=(0,39…0,79) %Д, Е=(1,52…2,85) ед. изм. углов; (табл. 1).

Очевидно, что при практическом применении нет необходимости рассматривать и учитывать степень корреляционной связи вышеперечисленных способов.

Таблица 1 - Зависимость срединных ошибок по дальности (в %Дизм.) и по направлению (в ед. изм. углов) от учета коррелированности поправок при равноточных измерениях

Д/Дmax По дальности По направлению
С учетом коррелир. поправок Без учета коррелир. поправок С учетом коррелир. поправок Без учета коррелир. поправок
0,15 0,42 0,39 1,71 1,61
0,30 0,38 0,40 1,60 1,58
0,45 0,36 0,42 1,58 1,52
0,60 0,32 0,34 1,52 1,62
0,75 0,36 0,39 1,66 1,64
0,9 0,40 0,41 1,86 1,69
1,0 0,42 0,39 2,31 1,98
 

Заслуживает интереса тот факт, что при определении ошибки рекомендуемого способа установлено: способ равноточных измерений дает меньшую ошибку по дальности и несколько меньшую ошибку по направлению, чем способ неравноточных измерений. Это связано с тем, что при неравноточной обработке результатов измерений были приняты одинаковые срединные ошибки, как для коррелированных способов, так и для некоррелированных. Исследования показали, что расчет уточненных коэффициентов корреляции, при своей сложности, приводит к увеличению точности на (0,01…0,04) %Д и на (0,1…0,3) единиц измерения углов по сравнению со способом равноточных измерений. С практической точки зрения такое несущественное увеличение точности не может компенсировать значительное усложнение расчетов, особенно если нет возможности использовать СЭВМ. Кроме того, как утверждалось ранее, «нет смысла уменьшать ошибку способа определения установок больше чем до ΔСп Диф./3…» [4], в противном случае ‑ систематическая ошибка способа будет нивелировать повышение точности. С практической точки зрения это означает, что использование двух-трех менее точных результатов дает меньшую ошибку, чем учет одного-двух более точных.

Таким образом, при использовании способа комплексного учета условий измерений срединные ошибки определения данных значительно меньше, чем ошибки рекомендованных способов определения данных. Использование этого способа не требует дополнительных материальных затрат и новых приборов для проведения измерений.

Литература

  1. Коваленко И.Н., Филиппова А.А. Теория вероятностей и математическая статистика. – М.: Высшая школа, 1982. – 256 с.
  2. Пугачев В.С. Теория вероятностей и математическая статистика. – М.: Наука, 1979. – 495 с.
  3. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. – М.: Академия, 2003. – 464 с.
  4. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. – Л.: Энергоатомиздат, 1985. – 248 с.
  5. Красс М.С., Чупрынов Б.П. Математика в экономике. Математические методы и модели. – М.: Финансы и статистика, 2007. – 544 с.