SIMPLE SOLUTION OF HERMIT INTERPOLATION PROBLEM

Research article

Shustov V.V.

DOI:

https://doi.org/10.23670/IRJ.2018.70.028

Issue: № 4 (70), 2018

Published:

2018/04/19

PDF

Шустов В.В.

ORCID: 0000-0002-2465-7475, Кандидат технических наук,

ФГУП Государственный научно-исследовательский институт авиационных систем, Москва

ПРОСТОЕ РЕШЕНИЕ ИНТЕРПОЛЯЦИОННОЙ ЗАДАЧИ ЭРМИТА

Аннотация

Рассмотрена интерполяционная задача Эрмита о построении многочлена, принимающего заданные значения функции и ее производных в узловых точках. Предложен новый способ решения этой задачи. На основе использования формулы Тейлора осуществлено упрощение вывода формулы интерполяционного многочлена Эрмита. Предложена интерпретация этого многочлена в представлениях многочлена Тейлора. Указан алгоритм получения конечных формул для многочлена Эрмита в случаях, когда максимальные порядки производных, заданных в узловых точках, одинаковы.

Ключевые слова: задача Эрмита, многочлен Тейлора, формула для интерполяционного многочлена Эрмита, интерпретация многочлена Эрмита.

Shustov V.V.

ORCID: 0000-0002-2465-7475, PhD in Engineering,

FSUE State Research Institute of Aviation Systems, Moscow

SIMPLE SOLUTION OF HERMIT INTERPOLATION PROBLEM

Abstract

The Hermite interpolation problem on the construction of a polynomial taking given values of a function and its derivatives at the nodal points is considered. A new way of solving this problem is proposed. Using the Taylor formula, we simplified the derivation of the Hermite interpolation polynomial formula. An interpretation of this polynomial in the representations of the Taylor polynomial is proposed. An algorithm is given for obtaining finite formulas for the Hermite polynomial in cases when the maximal orders of the derivatives given at the node points are the same.

Keywords: Hermite problem, Taylor polynomial, the formula for the Hermite interpolation polynomial, interpretation of the Hermite polynomial.

Введение

Интерполяционный многочлен Эрмита известен давно [1], [2, С. 163], [3, С. 71], [4, С. 154], [5, С. 143], [6] и используется в теории и практике для различных целей. В частности, он применяется для интерполяции функций, заданных в виде таблиц, в которых заданы значения функции и значения ее производных, и может использоваться для аппроксимации функций, принадлежащих определенному классу гладкости. В этом случае для повышения точности приближения используются данные о значениях функции и ее производных в нескольких точках отрезка.

Данный подход в случае выбора аппроксимирующей функции в классе многочленов приводит к задаче интерполирования Эрмита [2, С. 163-165] и рассмотренной в [1, С. 70-79]. Для решения задачи интерполяции строится многочлен, называемый интерполяционным многочленом Эрмита.

Вывод представления для интерполяционного многочлена Эрмита в общем случае для произвольного числа узловых точек приводится, например, в [2, С. 169-172], [3, С. 71-73], [4, С. 154-155] и является сложным и достаточно объемным. Вывод представления связан с предельными переходами и при некоторых подходах требует использования методов теории функций комплексного переменного.

Сложность вывода общей формулы для многочлена Эрмита побуждает ряд авторов тем или иным путем упростить его. Например, в работе [7] упрощение ищется в рамках линейной алгебры путем обращения матрицы.

Целью настоящей работы является с одной стороны дальнейшее упрощение вывода представления для интерполяционного многочлена Эрмита, с другой стороны разработка способов представления этого многочлена в конечном виде для частных случаев.

Постановка и решение задачи

Пусть в n+1 различных точках отрезка [x₀,x_n], удовлетворяющих условию

x₀ < x₁< … < x_n , заданы значения функции f(x) и ее производных до порядка α_i–1 включительно:

(1)

Вслед за [3, С. 71] будем считать, что производная нулевого порядка есть сама функция, т.е. f⁽⁰⁾(x)= f(x).

Необходимо построить интерполирующую функцию в классе многочленов, которая удовлетворяла бы условиям (1). Для решения задачи введем следующие обозначения.

Поставим в соответствие каждой узловой точке x_i функцию ω_i(x) определяемую формулой:

(2)

Функцию ω_i(x), которая также является многочленом, можно записать в виде:

(3)

(4)

Функции ω_i(x), как это следует из формулы (2), в точках x_l ≠x_i обращаются в нуль вместе со своими производными до порядка α_i–1 включительно и не обращаются в нуль в собственных точках x_i, т.е.

(5)

(6)

Через обозначим многочлен Тейлора степени α_i –1 для функции f(x), построенный для точки x_i, по значениям производных, определенных условием (1):

(7)

В некоторых случаях верхний индекс в обозначении будем опускать.

Представим H(x) в виде суммы многочленов H_i(x), где H_i(x) строится для каждой узловой точке x_i, т.е.

(8)

Можно записать тождество, верное для всех точек, в которых знаменатель не обращается в нуль:

т.е. выделим из функции f(x) первый сомножитель ω_i(x), который в соответствии с (2) обращается в нуль во всех узловых точках, кроме x_i, и второй сомножитель f(x)/ω_i(x).

Многочлен H_i(x) для каждой узловой точке x_i построим в виде произведения двух сомножителей. В качестве первого сомножителя возьмем функцию ω_i(x), которая в соответствии с (5) и (6) обладает теми свойствами, что она обращается в нуль сама вместе со своими производными до порядка α_i–1 включительно в каждой узловой точке x_l, отличной от точки x_i. Второй сомножитель f(x)/ω_i(x) , так как ω_i(x_i)≠0, представим в виде многочлена Тейлора для точки x_i степени α_i–1 включительно с учетом условия (1), что в точке x_i заданы производные до порядка α_i–1 включительно. В соответствии с рассуждениями, изложенными выше, можно записать, что

(9)

или, записывая многочлен Тейлора в явном виде согласно (7), как:

(10)

Подставляя H_i(x) из (9) в (8) получим, что суммарный интерполяционный многочлен H(x) представляется в следующем простом виде:

(11)

В силу представления H(x) в виде (8) и свойств функции ω_i(x), выраженных (5) и (6), следует, что значения H(x) и его производных в точках x_i определяются только значениями многочленов H_i(x) и их производных в этих точках, т.е.

Это объясняется тем, что в соответствии с (5) и (6) значения H_i(x_j) и их производных в точках x_j при j≠i равны нулю.

Многочлен H(x) с учетом представления многочлена Тейлора формулой (7) может быть записан в виде:

25-04-2018 14-39-52 (12)

Степень интерполяционного многочлена

Степень s многочлена H(x) определяется степенями s_i многочленов H_i(x), которые в свою очередь определяются в соответствии с формулой (9) суммой s_i степеней сомножителей ω_i(x) и , т.е.

s_i = (α₀ + α₁ +…+ α_i_–₁+ α_i₊₁…+ α_n)+(α_i – 1),

в которой скобками выделены степени сомножителей. Эту формулу для степени s_i многочлена H_i(x) можно записать в виде:

из которого видно, что степень s_i многочлена H_i(x) для всех значений i, определяемых условиями (1), одна и та же.

Из этой формулы и из того, что степень суммы многочленов не превосходит максимума из степеней многочленов суммы, следует, что максимальная степень s многочлена H(x), определяемого (8), выражается формулой:

(13)

Проверка заданных условий для многочлена

Покажем, что построенный многочлен H(x), представленный формулой (12), удовлетворяет и условиям (1).

Используя формулу для производной j-го порядка произведения двух функций (см. например, [8, С. 149])

(14)

и свойство многочлена Тейлора, выраженное формулой

найдем производную j-го порядка многочлена H(x), определенного формулой (11):

Далее, вычислим значение этой производной в точке x=x_i , заменив обозначение переменной внешнего суммирования i на l:

25-04-2018 14-45-59 (15)

Заметим, что при суммировании по переменной l после подстановки x=x_i, в силу свойства (5) функции ω_i(x) остаются только слагаемые, отвечающие условию l=i, т.е. знак суммирования по l исчезает.

Далее, так как ω_i(x_i)≠0, то при дифференцировании тождества

j раз, использовании формулы (14) и подстановке x=x_i, получим что 25-04-2018 15-01-08

(16)

Так как правые части формул (15) и (16) равны между собой, то по свойству числовых равенств и левые части равны друг другу, т.е. для всех j = 0,1,…α_i–1 и для всех i = 0,1,…n имеет место:

а это и означает, что построенный многочлен H(x) удовлетворяет условиям (1).

Выделение производных в явном виде

Для того, чтобы выделить значения производных в узловых точках в явном виде, выполним некоторые преобразования. Используя формулу (14) для определения производной j-го порядка от произведения двух функций, формулу (12) для H(x) можно записать в виде:

25-04-2018 15-03-39

или с учетом обозначений (1) как 25-04-2018 15-04-35

(17)

Здесь и, далее, буквами m_i , i=0,1 обозначены порядки наивысших производных, используемых для построения двухточечного многочлена H(x), т.е.

(18)

и используется формула для биноминальных коэффициентов

(19)

Для того, чтобы вынести обозначения производных из-под знака внутреннего суммирования, в формуле (17) для H(x) поменяем порядок суммирования по переменным j и k и, соответственно, пределы суммирования:

25-04-2018 15-07-26

Перейдем к новой переменной суммирования l, определенной формулой l=j–k, из которой следует, что j=l+k. После перехода к переменной l изменятся пределы внутреннего суммирования: при j=k имеет место l=0, при j=m_i имеет место l= m_i–k. Тогда формула для H(x) примет вид:

25-04-2018 15-09-37

Еще раз поменяем обозначения для внутренних переменных суммирования: k=j и l=k. Тогда H(x) можно записать как

После подстановки в эту формулу выражения для биноминальных коэффициентов (19) и сокращения числителя и знаменателя дроби на (j+k)! получим, что

25-04-2018 15-11-55 (20)

Если внести сомножитель ω_i(x) под знак суммирования по переменной k, то формулу (20) можно записать как:

25-04-2018 15-12-50

Эта формула для многочлена H(x) с точностью до обозначений (см. формулы (3) и (4)) совпадает с формулой для этого многочлена, приведенной, например в [2, С. 172] и полученной другим путем, что дает дополнительное подтверждение верности представления многочлена в форме (11).

Если в формуле (20) вынести члены, не зависящие от индекса суммирования по k в внешний цикл, то формула для многочлена H(x) примет вид:

(21)

В соответствии с полученными результатами имеет место следующая теорема.

Теорема

Пусть функция f(x) определена и достаточное число раз дифференцируема на отрезке [x₀,x_n], а также удовлетворяет условиям (1). Тогда существует многочлен степени не выше s, определенной формулой (13), который представляется в любой из форм (11), (12) или (21).

Интерпретация интерполяционного многочлена

Если в формуле (21) внести сомножитель ω_i(x) под знак суммирования по переменной j и сгруппировать сомножители, то формула для H(x) примет следующий вид:

25-04-2018 15-15-26 (22)

Обозначим выражение в скобке как φ_ij(x), т.е.

(23)

и назовем φ_ij(x) поправочной функцией.

С учетом обозначения (23) формулу (22) для H(x) можно записать в виде:

(24)

Из представления (24) видно, что многочлен, построенный по заданным значениям функции и ее производных в точках отрезка [x₀,x_n], есть сумма модифицированных многочленов Тейлора, построенных для каждой узловой точки x_i этого отрезка. Модификация разложения заключается в том, что каждый член многочлена Тейлора в данной точке x_i умножается на поправочную функцию, зависящую как от расстояния до других узловых точек, так и от порядков наивысших известных производных в этих точках.

Практическим следствием указанной интерпретации является то, что для построения интерполяционного многочлена Эрмита, соответствующего заданной функции, можно брать коэффициенты известного представления этой функции в ряд Тейлора в соответствующих узловых точках, не определяя их заново.

Частные случаи многочлена Эрмита. Отметим частные случаи многочлена Эрмита. Предварительно путем последовательного дифференцирования выпишем следующие соотношения для производных функции, выражение для которой является обратным для функции ω(x):

25-04-2018 15-18-24

Случай 1

Пусть во всех узловых точках отрезка заданы функции и значения ее первой производной, что соответствует условию:

С учетом формул для значений производных (25)–(27) формула (22) для многочлена H(x) при обозначении его как H₁(x) примет вид:

С точностью до обозначений эта формула соответствует формуле, приведенной в [3, С. 74] .

Случай 2

Пусть во всех узловых точках отрезка заданы функции и значения ее первой и второй производной, что соответствует условию

В этом случае формулу (22) для многочлена H(x) при обозначении его как H₂(x) с учетом формул для значений производных (25)–(27) можно записать в виде

Продолжая ряд формул (25)–(27) и используя (22), можно получить аналогичные формулы для многочлена H(x) для последующих значений m=3,4… – максимального порядка заданных в узлах значений производных, не решая частных задач интерполяции для каждого конкретного значения m, как это делается для m=1 в [2, С. 167].

Случай 3

Пусть имеются только две узловые точки, в которых заданы значения функции и ее производных, что соответствует значению n=1. В этом случае общая формула для представления интерполяционного многочлена Эрмита может быть существенно упрощена и доведена до конечного вида.

Формула (3) для ω_i(x) с учетом (4) записывается в виде

(28)

С использованием (28) легко устанавливается, что производная k-го порядка от обратной величины ω_i(x) представляется как

и, соответственно, значение этой производной при x=x_i выражается соотношением

(29) С учетом (28) и (29) формулу (21) для многочлена H(x) можно записать в виде

Введя обозначения для относительных переменных ξ_i

и используя выражение для биномиального коэффициента , определенного (19), получим конечную формулу для двухточечного интерполяционного многочлена Эрмита

(30)

которая соответствует представлению этого многочлена, полученному в [9, С. 1080].

Подробное исследование этого случая и применение двухточечных интерполяционных многочленов Эрмита для аппроксимации функций при симметричном и несимметричном распределении производных на концах отрезка и его оптимизация проведено в [9] и [10], соответственно.

Заключение

В работе осуществлен простой вывод формулы интерполяционного многочлена Эрмита на основе использования многочлена Тейлора. Предложена интерпретация многочлена Эрмита как сумма модифицированных многочленов Тейлора, построенных для каждой из узловых точек. Указан алгоритм получения конечных формул для этих многочленов в случае, когда максимальные порядки производных, заданных в узловых точках, одинаковы.

Список литературы / References

Hermite Sh. Sur la formule d'interpolation de Lagrange / Sh. Hermite // Journal fur die reine und angewandte Mathematik. – 1878. – Vol. 84. – P. 70–79.
Березин И. С. Методы вычислений. Т. 1 / И. С. Березин, Н. П. Жидков – М.: Физматлит, 1962. – 464 с.
Гончаров В.И. Теория интерполирования и приближения функций. / В. И. Гончаров. – М.: Гостехтеориздат, 1934. – 316 с.
Прасолов В. В. Многочлены. / В. В. Прасолов – М.: МЦНМО. – 1999. – 336с.
Микеладзе Ш. Е. Численные методы математического анализа. / Ш. Е. Микеладзе – М.: Гостехтеориздат, 1953. – 528 с.
Spitzbart A. A generalization of Hermite's interpolation formula / A. Spitzbart // Amer. Math. Monthly, 1960. – 67. – P. 42–46.
Stanica D. A short proof of the Hermite’s formula for polynomial interpolation using operator methods / D. Stanica // Annals of the Alexandru Ioan Cuza University – Mathematics. – 2015. – Vol 61. – P. 209–215. doi: 10.2478/aicu-2013-0040
Кудрявцев Л. Д. Математический анализ. Т. 1. / Л. Д. Кудрявцев – М.: Высшая школа, 1970. – 590 с.
Шустов В. В. О приближении функций двухточечными интерполяционными многочленами Эрмита / В. В. Шустов // Журнал вычислительной математики и математической физики. – 2015. – Т. 55. – № 7. – С. 1091–1108.
Шустов В. В. Аппроксимация функций несимметричными двухточечными многочленами Эрмита и ее оптимизация / В. В. Шустов // Журнал вычислительной математики и математической физики. – 2015. – Т. 55. – № 12. – С. 1999–2014.

Список литературы на английском языке / References in English

Hermite Sh. Sur la formule d'interpolation de Lagrange / Sh. Hermite // Journal fur die reine und angewandte Mathematik. – 1878. – Vol. 84. – P. 70–79.
Berezin I. S. Computing Methods. / I. S. Berezin, N. P. Zhidkov. Vol. 1 – Pergamon: Oxford, 1965. – 464 P.
Goncharov V. I. Teoriya interpolirovaniya i priblizheniya funktsij [The theory of interpolation and approximation of functions] / V. I. Goncharov. – M.: Gostekhteorizdat, 1934. – 316 P. [in Russian]
Prasolov V. V. Mnogochleny [Polynomials] / V. V. Prasolov. – М.: МTSNMO, 1999. – 336 P. [in Russian]
Mikeladze Sh. E. Chislennye metody matematicheskogo analiza [Numerical methods of mathematical analysis] / Sh. E. Mikeladze. – M.: Gostekhteorizdat, 1953. – 528 P. [in Russian]
Spitzbart A. A generalization of Hermite's interpolation formula / A. Spitzbart // Amer. Math. Monthly, 1960. – Vol. 67. – P. 42–46.
Stanica D. A short proof of the Hermite’s formula for polynomial interpolation using operator methods / D. Stanica // Annals of the Alexandru Ioan Cuza University – Mathematics. – 2015. – Vol 61. – P. 209–215. doi: 10.2478/aicu-2013-0040
Kudryavtsev L. D. Matematicheskij analiz [Mathematical analysis] T. 1 / L. D. Kudryavtsev – M: Vysshaya Shkola, 1970. – 590 P. [in Russian]
Shustov V. V. Approximation of functions by two-point Hermite interpolating polynomials / V. V. Shustov // Computational Mathematics and Mathematical Physics. – 2015. – Vol. 55. – No 7. – P. 1077–1093. doi: 10/1134/S0965542515040156
Shustov V. V. Approximation of functions by asymmetric two-point Hermite polynomials and its optimization / V. V. Shustov // Computational Mathematics and Mathematical Physics. – 2015. – Vol. 55. – No 12. – P. 1960–1974. doi: 10/1134/S0965542515120155