Выпуклая функция
Выпуклая функция (выпуклая вниз функция) — функция, для которой отрезок между любыми двумя точками её графика в векторном пространстве лежит не ниже соответствующей дуги графика. Эквивалентно: выпуклой является функция, надграфик которой является выпуклым множеством.
Вогнутая функция (выпуклая вверх функция) — функция, хорда между любыми двумя точками графика которой лежит не выше образованной дуги графика, или, что эквивалентно, подграфик которой является выпуклым множеством.
Понятия выпуклой и вогнутой функции двойственны, притом некоторыми авторами выпуклая функция определяется как вогнутая, и наоборот. Иногда во избежание недоразумений используют более явные термины: выпуклая вниз функция и выпуклая вверх функция.
Понятие имеет важное значение для классического математического анализа и функционального анализа, где особо изучаются выпуклые функционалы, а также для таких приложений, как теория оптимизации, где выделяется специализированный подраздел — выпуклый анализ.
Определения
Числовая функция, определённая на некотором интервале (в общем случае на выпуклом подмножестве некоторого векторного пространства), выпукла, если для любых двух значений аргумента x {displaystyle x} , y {displaystyle y} и для любого числа t ∈ [ 0 , 1 ] {displaystyle tin left[0,1 ight]} выполняется неравенство Йенсена:
f ( t x + ( 1 − t ) y ) ⩽ t f ( x ) + ( 1 − t ) f ( y ) {displaystyle f{ig (}tx+left(1-t ight)y{ig )}leqslant tfleft(x ight)+left(1-t ight)fleft(y ight)}Замечания
- Если это неравенство является строгим для всех t ∈ ( 0 , 1 ) {displaystyle tin left(0,1 ight)} и x ≠ y {displaystyle x eq y} , то функция называется строго выпуклой.
- Если выполняется обратное неравенство, функция называется вогнутой (соответственно, строго вогнутой для строгого случая).
- Если для некоторого ε > 0 {displaystyle varepsilon >0} выполняется более сильное неравенство f ( t x + ( 1 − t ) y ) ⩽ t f ( x ) + ( 1 − t ) f ( y ) − ε t ( 1 − t ) | x − y | 2 {displaystyle f{ig (}tx+left(1-t ight)y{ig )}leqslant tfleft(x ight)+left(1-t ight)fleft(y ight)-varepsilon tleft(1-t ight)left|x-y ight|^{2}}
Свойства
- Функция f {displaystyle f} , выпуклая на интервале I {displaystyle mathbb {I} } , непрерывна на всём I {displaystyle mathbb {I} } , дифференцируема на всём I {displaystyle mathbb {I} } за исключением не более чем счётного множества точек и дважды дифференцируема почти всюду.
- Любая выпуклая функция является субдифференцируемой (имеет субдифференциал) на всей области определения.
- У выпуклой функции через любую точку проходит опорная гиперплоскость её надграфика.
- Непрерывная функция f {displaystyle f} выпукла на I {displaystyle mathbb {I} } тогда и только тогда, когда для всех точек x , y ∈ I {displaystyle x,yin mathbb {I} } выполняется неравенство f ( x + y 2 ) ⩽ f ( x ) + f ( y ) 2 {displaystyle fleft({dfrac {x+y}{2}} ight)leqslant {frac {fleft(x ight)+fleft(y ight)}{2}}}
- Непрерывно дифференцируемая функция одной переменной выпукла на интервале тогда и только тогда, когда её график лежит не ниже касательной (опорной гиперплоскости), проведённой к этому графику в любой точке промежутка выпуклости.
- Выпуклая функция одной переменной на интервале имеет левую и правую производные; левая производная в точке меньше или равна правой производной; производная выпуклой функции — неубывающая функция.
- Дважды дифференцируемая функция одной переменной выпукла на интервале тогда и только тогда, когда её вторая производная неотрицательна на этом интервале. Если вторая производная дважды дифференцируемой функции строго положительна, такая функция является строго выпуклой, однако обратное неверно (например, функция f ( x ) = x 4 {displaystyle fleft(x ight)=x^{4}} строго выпукла на [ − 1 , 1 ] {displaystyle left[-1,1 ight]} , но её вторая производная в точке x = 0 {displaystyle x=0} равна нулю).
- Если функции f {displaystyle f} , g {displaystyle g} выпуклы, то любая их линейная комбинация a f + b g {displaystyle af+bg} с положительными коэффициентами a {displaystyle a} , b {displaystyle b} также выпукла.
- Локальный минимум выпуклой функции является также глобальным минимумом (соответственно, для выпуклых вверх функций локальный максимум является глобальным максимумом).
- Любая стационарная точка выпуклой функции будет глобальным экстремумом.