Неједнакост је релација поретка у скупу реалних бројева (ℝ), са особинама:
- a ≤ a, рефлексија,
- (a ≤ b ∧ b ≤ a) ⇒ (a = b), антисиметрија,
- (a ≤ b ∧ b ≤ c) ⇒ (a ≤ c), транзитивност,
за све a, b, c ∈ ℝ. Строга неједнакост (a < b) нема особине рефлексивности и антисиметрије (1 и 2), а следећа два су примери релације „поретка“ без транзитивности.
1. Пример. На слици лево је магични квадрат 3×3, чији збир бројева у сваком ретку, у свакој колони и обе дијагонале је 15. У првој, другој и трећој колони су постигнути бодови тимова A, B и C у међусобним дуелима. Тако је у три партије A против B у освојеним бодовима било 4:9, 3:5 и 8:1, што значи да је тим A изгубио од B укупним резултатом 1 : 2.
Према томе, прва колона је скор тима A који је резултатом 1 : 2 изгубио од тима B у другој колони. Тим B је изгубио једнаким резултатом 1 : 2 од тима C у трећој колони. Међутим, та табела показује да тим A побеђује тим C резултатом 2 : 1.
Ово је пример нетранзитивности „релације поретка“, јер пораз A ≪ B и пораз B ≪ C не значи пораз A ≪ C. Недоследности ове врсте типичне су у неким ситуацијама (намерно толерисаним) пребројавања гласова по биралиштима, који се затим групишу и заокружују за више нивое. □
2. Пример. Лакша игра „Камен, папир, маказе“, приказана на слици десно, још један је пример нетранзитивности „релације поретка“. Два играча држе сакривену шаку једне руке иза леђа и одједном је оба покажу. Стиснута шака је „камен“, свих прста испружених су „папир“, а испружена само два значе „маказе“.
Правила игре су следећа: играч који је показао камен побеђује оног који формира маказе („камен ломи маказе”), а губи од оног који има папир („папир прекрива камен”), док играч са маказама побеђује играча са папиром („маказе секу папир”). Уколико оба играча покажу исти елемент, исход је нерешен резултат.
Дакле: ... ≪ папир ≪ маказе ≪ камен ≪ папир ≪ ..., што је нарушавање релације транзитивности. □
Многе релације можемо лакше разумети помоћу графова. Ове нетранзитивности биле би кружно повезан граф, где је „лево од“ нетранзитивна релација „поретка“. Наиме, у низу корака у десно доћи ћемо опет до почетног. Недовољно повезан граф, пак, може представљати ситуацију када имамо повезивање a → b и b → c, али немамо везу a → c и, према томе, немамо транзитивност.
Уопште, релацију дефинишемо и као скуп уређених парова. Тада је ρ = {(a, b), (b, c), (a, c)} једноставан пример транзитивне релације која није рефлексивна, нити је антисиметрична.
1. Неједнакости средина
Универзалне неједнакости често се односе на низове и средње вредности њихових чланова. Нека такав један буде низ позитивних реалних бројева x1, ..., xn ∈ ℝ, где је природан број n = 1, 2, 3, ... индекс који нумерише и пребројава чланове низа. Тада имамо следеће средине:
- \( \min = \min(x_1, ..., x_n) \) — минимални члан низа;
- \( H = \frac{1}{\frac{1}{x_1} + ... + \frac{1}{x_n}} \) — хармонијска средина;
- \( G = \sqrt[n]{x_1\cdot ...\cdot x_n} \) — геометријска средина;
- \( A = \frac{x_1 + ... + x_n}{n} \) — аритметичка средина;
- \( Q = \sqrt{\frac{x_1^2 + ... + x_n^2}{n}} \) — квадратна средина;
- \( \max = \max(x_1, ..., x_n) \) — максимални члан.
Увек важе неједнакости min ≤ H ≤ G ≤ A ≤ Q ≤ max, а једнакости важе акко x1 = ... = xn. Следе докази.
3. Став. Нека су x и y позитивни (реални) бројеви. Тада важе неједнакости:
\[ \min(x, y) \le \frac{1}{\frac{1}{x} + \frac{1}{y}} \le \sqrt{xy} \le \frac{x + y}{2} \le \sqrt{\frac{x^2 + y^2}{2}} \le \max(x, y), \]где стоје једнакости ако и само ако x = y.
Доказ: Ставимо 0 ≤ x ≤ y, што не умањује општост доказа. Тада је очигледно:
\[ \frac{1}{\sqrt{xy}} \le \frac{1}{x} \le \frac{1}{y}, \] \[ \frac{2}{\sqrt{xy}} \le \frac{1}{x} + \frac{1}{y} \le \frac{2}{y}, \] \[ \min(x, y) \le \frac{1}{\frac{1}{x} + \frac{1}{y}} \le \sqrt{xy} \le \frac{x + y}{2} \le \max(x, y). \]Такође је \( 0 \le (a + b)^2 = a^2 + 2ab + b^2 \), одакле \( 2ab \le a^2 + b^2 \), па сменом \( a^2 = x\), \( b^2 = y^2 \), налазимо
\[ \sqrt{xy} \le \frac{x + y}{2}, \]а то је неједнакост геометријске и аритметичке средине (G ≤ A), горе већ доказана. Овде нам треба за:
\[ x^2 + 2xy + y^2 \le 2x^2 + 2y^2, \quad x^2 + y^2 \le y^2 + y^2, \] \[ \frac{x^2 + 2xy + y^2}{4} \le \frac{x^2 + y^2}{2} \le y^2, \] \[ \frac{x + y}{2} \le \sqrt{\frac{x^2 + y^2}{2}} \le \max(x, y). \]То су преостале неједнакости A ≤ Q ≤ max. Из поступка лако доказујемо да једнакости важе ако и само ако x = y. ∎
1.1. Лево је цртеж круга центра у тачки O ∈ AB и пречника AB = x + y, са полупречником:
Тачка C припада кружници, па је троугао ABC правоугли. Из темена правог угла C спуштена је висина CD = h на хипотенузу, тако да је h² = xy. Наиме, из сличних троуглова ADC ∼ CDB следи пропорција h : x = y : h, а отуда наведено h² = xy.
Из конструкције је очигледна неједнакост
\[ \sqrt{xy} \le \frac{x + y}{2}, \]тј. h ≤ r, а то је неједнакост геометријске и аритметичке средине (G ≤ A), која постаје једнакост ако и само ако x = y.
1.2. На слици десно је иста претходна слика круга, а без тамошњег правоуглог троугла и са додатим другим правоуглим троугловима. И даље остаје аритметичка средина A = (x + y)/2 делова x и y пречника, а \( G = \sqrt{xy} \) као геометријска средина истих.
Додата је хипотенуза Q, чији је квадрат:
\[ Q^2 = \left(\frac{y - x}{2}\right)^2 + A^2 = \] \[ = \frac{x^2 - 2xy + y^2}{4} + \frac{x^2 + 2xy + y^2}{4}, \]одакле је Q² = (x² + y²)/2, па је Q квадратна средина. Из правоуглих троуглова доле и лево, ове слике, налазимо:
\[ G^2 = b^2 + H^2, \quad H:G = b:\left(\frac{y-x}{2}\right), \] \[ G^2 = H^2 \left[\frac{H}{G}\left(\frac{y-x}{2}\right)\right]^2 + H^2 = H^2\left( \frac{y^2 - 2yx + x^2}{4xy} + 1 \right)^2 = H^2\left(\frac{y + x}{2}\right)^2, \] \[ H = \frac{G}{A} = \frac{\sqrt{xy}}{\frac{y+x}{2}} = \frac{2}{\frac{1}{x} + \frac{1}{y}}, \]а то је хармонијска средина.
1.3. Ево још једног геометријског примера. Слика лево приказује квадрате страница x и y поравнате на подлози који се бочно се додирују. Доказаћемо неједнакост аритметичке и квадратне средине.
Половине дијагонала су им DE и EC редом \(x/\sqrt{2}\) и \(y/\sqrt{2}\). Троугао DEC је правоугли, ∠C = 90°, па је квадрат хипотенузе:
\[ CD^2 = DE^2 + EC^2 = \] \[ = \left(\frac{x}{\sqrt{2}}\right)^2 + \left(\frac{y}{\sqrt{2}}\right)^2 = \frac{x^2 + y^2}{2}. \]Међутим, она је дужи крак трапеза ABCD, где је AB ≤ CD, па је \( (x + y)/2 \le \sqrt{(x^2 + y^2)/2} \), а отуда нам неједнакост аритметичке и квадратне средине (A ≤ Q).
1.4. Свака од ових средина повећа се када низ допунимо бројем већим од ње. Тако из x1x2 ≤ x3², када обе стране помножимо са (x1x2)², следи (x1x2)³ ≤ (x1x2x3)², а отуда вадећи шести корен из обе стране неједнакости \( \sqrt{x_1x_2} \le \sqrt[3]{x_1x_2x_3} \), што можемо писати G2 ≤ G3. Подсећам, сви бројеви са којима овде радимо су позитивни реални.
Када је следећи члан n-торке позитивних бројева већи од њихове геометријске средине Gn, тада је:
\[ x_1\cdot ... \cdot x_n \le x_{n+1}^n, \] \[ (x_1\cdot ... \cdot x_n)^{n+1} \le (x_1\cdot ... \cdot x_n)^n x_{n+1}^n, \] \[ \sqrt[n]{x_1\cdot ... \cdot x_n} \le \sqrt[n+1]{x_1\cdot ... \cdot x_n \cdot x_{n+1}}, \] \[ G_n \le G_{n+1}. \]То важи и за сваки низ позитивних бројева x1, ..., xn ∈ ℝ који је неопадајући (свако xk ≤ xk+1, редом када k = 1, 2, ..., n-1), или је строго растући (свако xk < xk+1).
Аналогно доказујемо за аритметичку средину. Али то можемо и непосредно из претходног, овако:
\[ \ln G_n \le \ln G_{n+1}, \] \[ \frac{1}{n}(\ln x_1 + ... + \ln x_n) \le \frac{1}{n+1}(\ln x_1 + ... + \ln x_{n+1}), \] \[ \frac{a_1 + ... + a_n}{n} \le \frac{a_1 + ... + a_{n+1}}{n}, \] \[ A_n \le A_{n+1}, \]када је следећи члан an+1 низа већи од аритметичке средине An претходних. Логаритам базе веће од 1 је растућа функција, тј. из 0 < x < y следи ln x < ln y, па овај доказ вреди након бирања произвољних ak па сменом ak = ln xk.
Аналогно за n-торке хармонијске (Hn) и квадратне (Qn) средине доказ пронађите сами, а одговарајуће неједнакости за минимум и максимум низова су очигледне. Уосталом, када боље размислите, запазите да је свака од тих неједнакости већ и интуитивно прихватљива. Такође, да средину смањује од ње мањи нови број у низу.
1.5. Докази наведених неједнакости средина, за дуже n-торке позитивних реалних бројева, нису тешки, нити тривијални, али су занимљиви, као што ћемо видети из следећих. У првом наредном видећемо и корисну методу Кошијеве (Augustin Louis Cauchy, 1789-1857, француски математичар) индукције: свако у низу тврђења Tn је тачно акко је тачно за n = 2, затим ако за произвољно n = 1, 2, 3, ... из тачности Tn следи тачност T2n потом и тачност Tn-1. Тачност је горњих неједнакости за n = 1 очигледна, па их зато не дискутујемо.
4. Став. За позитивне реалне бројеве x1, x2, ..., xn важи неједнакост (Gn ≤ An) између геометријске и аритметичке средине
\[ \sqrt[n]{x_1\cdot x_2 \cdot ... \cdot x_n} \le \frac{x_1 + x_2 + ... + x_n}{n}, \]где једнакост важи ако и само ако x1 = x2 = ... = xn.
Доказ: Доказ радимо методом Кошијеве индукције. Већ смо доказали да за n = 2 став важи (3. став). У другом кораку индукције, претпостављамо да став важи за n чланова и доказујемо да став важи за 2n чланова:
\[ \sqrt[2n]{x_1\cdot x_2 \cdot ... \cdot x_{2n}} = \] \[ = \sqrt{\sqrt[n]{x_1\cdot x_2 \cdot ... \cdot x_n}\cdot\sqrt[n]{x_{n+1}\cdot x_{n+2}\cdot ... \cdot x_{2n}}} \le \] \[ \le \frac{\sqrt[n]{x_1\cdot x_2 \cdot ... \cdot x_n} + \sqrt[n]{x_{n+1}\cdot x_{n+2} \cdot ... \cdot x_{2n}}}{2} \le \] \[ \le \frac12\left(\frac{x_1 + x_2 + ... + x_n}{n} + \frac{x_{n+1} + x_{n+2} + ... + x_n}{n}\right) = \] \[ \frac{x_1 + x_2 + ... + x_{2n}}{2n}. \]Дакле, доказали смо импликацију \( G_n \le A_n \implies G_{2n} \le A_{2n} \).
Докажимо сада да из Gn ≤ An следи Gn-1 ≤ An-1. Користимо супституцију
\[ x_n = \frac{x_1 + x_2 + ... + x_{n-1}}{n-1} \]тако да је
\[ \frac{x_1 + x_2 + ... + x_{n-1} + \frac{x_1 + x_2 + ... + x_{n-1}}{n-1}}{n} = \frac{x_1 + x_2 + ... + x_{n-1}}{n-1}. \]Затим имамо:
\[ \sqrt[n]{x_1\cdot x_2\cdot ... \cdot x_{n-1} \frac{x_1 + x_2 + ... + x_{n-1}}{n-1}} = \sqrt[n]{x_1\cdot x_2 ... \cdot x_{n-1}\cdot x_n} \le \] \[ \le \frac{x_1 + x_2 + ... + x_n}{n} = \frac{x_1 + x_2 + ... + x_{n-1}}{n-1}. \]Отуда је:
\[ x_1\cdot x_2\cdot ... \cdot x_{n-1} \frac{x_1 + x_2 + ... + x_{n-1}}{n-1} \le \left(\frac{x_1 + x_2 + ... + x_{n-1}}{n-1}\right)^n, \] \[ x_1\cdot x_2\cdot ... \cdot x_{n-1} \le \left(\frac{x_1 + x_2 + ... + x_{n-1}}{n-1}\right)^{n-1}, \] \[ \sqrt[n-1]{x_1\cdot x_2\cdot ... \cdot x_{n-1}} \le \frac{x_1 + x_2 + ... + x_{n-1}}{n-1}. \]Дакле, доказали смо и импликацију \( G_n \le A_n \implies G_{n-1} \le A_{n-1} \). Лако се проверава да неједнакост постаје једнакост акко x1 = x2 = ... = xn. Тиме је став доказан. ∎
5. Став. За позитивне реалне бројеве a1, ..., an важи неједнакост (Hn ≤ Gn) између хармонијске и геометријске средине
\[ \frac{n}{\frac{1}{a_1} + ... + \frac{1}{a_n}} \le \sqrt[n]{a_1\cdot \cdot ... \cdot a_n}, \]где једнакост важи ако и само ако a1 = ... = an.
Доказ: Користимо 4. став и смене ak = 1/xk редом за k = 1, ..., n. Добијамо:
\[ \sqrt[n]{x_1\cdot ... \cdot x_n} \le \frac{x_1 + ... + x_n}{n}, \] \[ \frac{1}{\sqrt{a_1\cdot ... \cdot a_n}} \le \frac{1}{n}\left(\frac{1}{a_1} + ... + \frac{1}{a_n}\right), \] \[ \frac{n}{\frac{1}{a_1} + ... + \frac{1}{a_n}} \le \sqrt[n]{a_1\cdot ... \cdot a_n}. \]Према томе, \( H_n \le G_n \), где једнакост важи акко a1 = ... = an, што је и требало доказати. ∎
6. Став. За позитивне реалне бројеве x1, ..., xn важи неједнакост (An ≤ Qn) између аритметичке и квадратне средине
\[ \left(\frac{x_1 + ... + x_n}{n}\right)^2 \le \frac{x_1^2 + ... + x_n^2}{n}, \]где једнакост важи ако и само ако x1 = ... = xn.
Доказ: Нека је \( f(x) = x^2 \). Други извод ове функције је \(f''(x) = 2 > 0 \), па је она конвексна. Отуда
\[ f\left(\frac{x_1 + ... + x_n}{n}\right) \le \frac{f(x_1) + ... + f(x_n)}{n}, \] \[ \left(\frac{x_1 + ... + x_n}{n}\right)^2 \le \frac{x_1^2 + ... + x_n^2}{n}, \]односно An ≤ Qn, где стоји једнакост акко x1 = ... = xn, а то је оно што је требало доказати. ∎
Очигледно је min(x1, ..., xn) ≤ Hn и Qn ≤ max(x1, ..., xn) и имамо све доказе ових неједнакости.
7. Пример. Знамо да је свака од страница a, b, c троугла мања од збира остале две. Колики би могао бити средњи количник збира две странице са трећом?
Решење: Проценимо је аритметичком средином тих односа:
\[ \frac13\left(\frac{a+b}{c} + \frac{b+c}{a} + \frac{c+a}{b}\right) \ge \sqrt[3]{\frac{a+b}{c} \cdot \frac{b+c}{a} \cdot \frac{c+a}{b}} \ge \] \[ \ge \sqrt[3]{\frac{2\sqrt{ab}\cdot 2\sqrt{bc} \cdot 2\sqrt{ca}}{cab}} = 2, \]где су кориштене неједнакости аритметичке и геометријске средине. За минималну средњу вредност испада да су све три странице једнаких дужина. □
2. Линеано програмирање
Под програмирањем ове подразумевамо тражење оптималне вредности циљне функције
у условима ограничења системом линеарних релација, датих (не)једначинама:
укључујући изоловане xi ≥ 0. Треба наћи екстрем функције g уз услове наведене системом.
Не умањује општост претпоставка bj ≥ 0, редом за све j = 1, 2, ..., m, јер ако је неко bj < 0 помножимо ту једначину са -1. Може се увести и претпоставка да су све ове релације једначине. То постижемо помоћу варијабле вишка yj = ±(ajxj - bj), где ставимо знак „плус“ ако је у релацији „веће“, а знак „минус“ ако је у релацији „мање“ (енг. slack variable). Број непознатих таквог новог система једначина већи је од броја непознатих полазних релација за број неједначина у тим релацијама. Горњи систем тада можемо писати матрично Ax = b.
2.1. Конвексан скуп у геометрији је подскуп Еуклидовог простора, чије било које две тачке повезује дуж која је сва у њему. На пример, чврста лопта, коцка, купа или ваљак конвексни су скупови, док све што је шупље или има удубљење као полумесец, није конвексно. Конвексни су празан скуп и сав простор, такође пресек сваке колекције конвексних скупова. Отуда следећа аналитичка дефиниција.
Скуп C је конвексан када линијски сегмент између било које две тачке у том скупу лежи у том скупу. Другим речима, (∀x1, x2 ∈ C, ∀θ ∈ [0, 1]) θx1 + (1 - θ)x2 ∈ C. Уопште, у конвексном скупу C, када имамо низ n = 1, 2, 3, ... тачака x1, x2, ..., xn ∈ C и ненегативних бројева λ1 + λ2 + ... + λn чији је укупни збир 1, онда је линеарна комбинација λ1x1 + λ2x2 + ... + λnxn ∈ C.
2.2. У случају линеарног програмирања, тражимо оптимално решење задате линеарне форме
8. Пример. Творница производи моделе M1 и M2 неке робе и то помоћу стројева S1 и S2. Први модел стројеви раде 2 и 4 часа, за други модел раде 4 и 2 часа. Зарада по комаду ових модела је 300 и 500 дин и треба организовати рад ових стројева да зарада буде што већа.
- Нека је x1 број израђених јединица модела M1 на дан.
- Нека је x2 број израђених јединица модела M2 на дан.
То значи да је циљна функција зарада
при чему су релације
\[ \begin{cases} 2x_1 + 4x_2 \le 24 \\ 4x_1 + 2x_2 \le 24 \\ x_1 \ge 0 \\ x_2 \ge 0 \end{cases} \]Решење сваке од ових неједначина (d, e, f, c) је затворена полураван у (Oxy) правоуглом систему кооридната (x = x1, y = x2), њихов пресек решење је све четири. На слици десно, то је конвексан четвороугао са теменима C(0, 0), D(6, 0), E(4, 4) и F(0, 6). Лако је доказати да се тражене екстремне вредности функције g појављују у теменима.
Њене вредности су редом g(C) = 0, g(D) = 1800, g(E) = 3200 и g(F) = 3000. Дакле, оптимум је постигнут у темену E(4, 4), када је x1 = 4 и x2 = 4. Tada се на строју S1 дневно изради 4 комада робе M1, а на строју S2 дневно изради 4 примерка робе M2. Дневна зарада је 3200 дин. □
Приметимо да се конструкцијом праве 300x + 500y = g са произвољним почетним g, на горњој слици, па њеним паралелним померањем добијају праве неизмењене леве стране њене једначине али разним вредностима g. Када једна од тих паралела садржи теме E(4, 4), онда је g = 3200, баш тражене највеће вредности. Свака од осталих паралела која би секла дати четвороугао имала би мање g од максимума, решења задатка.
То је скица опште методе решавања линеарног програмирања помоћу конвексних скупова. Задан је затворен конвексан скуп C у еуклидском простору ℝn с равним рубом и линеарна форма \( g = \sum_j^n c_jx_j \) чије екстремне вредности тражимо на C. У хиперпростору координата xj мењамо вредности g, али не и друге стране те једначине, паралелно померајући форму (хипер-раван) до руба C на којем ће g узети тражену екстремну вредност. То је опис геометријске итерације која се зове симплексна метода, јер се своди на конвексне скупове који су у једноставнијим случајевима симплекси (најмањи конвексни скупови који обухтавају задате тачке).
Наравно, може се десити да се нека од паралелних (хипер)равнина поклопи са страницом тела C када ће њених бесконачно много тачака све давати исти оптимум, или да (хипер)раван оде у бесконачност када задатак нема коначног решења.
2.3. Симплекс метода је начин ручног решавања модела линеарног програмирања коришћењем вишка (енг. slack) променљивих, табела и водећих варијабли као средства за проналажење екстрема, решења проблема оптимизације. За то су потребни кораци попут:
- Стандардна форма;
- Помоћне варијабле;
- Креирање листе (табеле);
- Излазне (водеће) варијабле;
- Прављење нове листе (табеле);
- Провера оптималности;
- Идентификација оптимума.
Ево примера задатка за линеарно програмирање симплекс методом помоћу списка (енг. dictionary). Мимимизирати -g уз дате услове:
\[ -g = -x_1 -2x_2 + x_3, \] \[ \begin{cases} 2x_1 + x_2 + x_3 \le 14 \\ -4x_1 - 2x_2 - 3x_3 \ge -28 \\ 2x_1 + 5x_2 + 5x_3 \le 30 \\ x_1, x_2, x_3 \ge 0 \end{cases} \]Стандардна форма (1) је основно полазиште свих линеарних програма пре решавања. За оптимално решење она има три захтева:
- мора бити проблем максимизације,
- сва линеарна ограничења морају бити у неједнакости мање од или једнако,
- све варијабле су ненегативне.
Ови захтеви су увек задовољиви трансформацијом било ког датог линеарног програма коришћењем основне алгебре и супституција. Стандардна форма је неопходна јер ствара идеалну полазну тачку за што ефикасније решавање Симплекс методе као и других метода решавања проблема оптимизације.
Трансформишемо минимизирајући линеарни програмски модел у максимизирајући опет линеарни програмски модел, множећи леву и десну страну функције циља са -1 и исто радимо са неједнакошћу веће него. Добијамо:
\[ g = x_1 + 2x_2 - x_3, \] \[ \begin{cases} 2x_1 + x_2 + x_3 \le 14 \\ 4x_1 + 2x_2 + 3x_3 \le 28 \\ 2x_1 + 5x_2 + 5x_3 \le 30 \\ x_1, x_2, x_3 \ge 0 \end{cases} \]Међу релације уводимо помоћне варијабле (2) y1, y2 и y3:
\[ \begin{cases} 2x_1 + x_2 + x_3 + y_1 = 14 \\ 4x_1 + 2x_2 + 3x_3 + y_2 = 28 \\ 2x_1 + 5x_2 + 5x_3 + y_3 = 30 \\ x_1, x_2, x_3, y_1, y_2, y_3 \ge 0 \end{cases} \]Да бисмо боље разумели решавање задатка табелирањем погледајмо пре тога списак експлицитно писаних помоћних варијабли:
\[ \begin{cases} y_1 = 14 - 2x_1 - x_2 - x_3 \\ y_2 = 28 - 4x_1 - 2x_2 - 3x_3 \\ y_3 = 30 - 2x_1 - 5x_2 - 5x_3 \\ g = 0 + x_1 + 2x_2 - x_3 \end{cases} \]Променљиве са леве стране су основне варијабле за овај списак; скуп ових променљивих назива се база. У почетном списку основне варијабле су помоћне променљиве, које се мењају након рачунања. Остале варијабле се називају неосновне. Приметите да смо на дну додали променљиву за функцију циља.
Придружено решење добије се када су све неосновне променљиве нуле и резулти су вредности основних променљивих из списка. За горњи списак придружено решење је:
\[ x_1 = x_2 = x_3 = 0, \quad y_1 = 14, \quad y_2 = 28, \quad y_3 = 30. \]Придружено решење задовољава услове, али можда не позитивност услова. Када оно задовољава и позитивност услова називамо га изводљивим (енг. feasible ) решењем. Овде је оно изводљиво, јер је програм задат таквим, ненегативним бројевима.
Основна идеја симплекс методе је прелазак са списка на списак уз замену основних решења неким не-основним, тако да циљна функција (g) расте сваким кораком и да списак сваким кораком остаје унутар неког изводљивог решења. Ево како бирамо варијабле за те кораке.
Из доње (g) једначине видимо да повећавањем x1 и x2 та циљана функција расте, а повећавањем x3 она опада. Све те три варијабле морају бити позитивни бројеви, па се тада горње yk смањују до нуле изнад које морају остати. Зато бирамо највећи коефицијент циљане функције, овде је то 2 уз x2, па добијамо:
\[ \begin{cases} y_1 = 14 - x_2 \\ y_2 = 28 - 2x_2 \\ y_3 = 30 - 5x_2 \\ g = 0 + 2x_2 \end{cases} \]Да би помоћне варијабле (ипсилони) били позитивни, x2 може ићи највише до 6, а то ограничава y3 и зато ту бирамо за водећу, излазну (енг. exiting) варијаблу. Када има више (истих) излазних варијабли, стандардно правило је да се узме прва од њих, она са најмањим индексом. Бирајући x2 за улазну, а y3 за излазну варијаблу и уврштавајући x2 у горње једначине израчунавамо нови списак:
\[ \begin{cases} x_2 = 6 - \frac25 x_1 - x_3 - \frac15 y_3 \\ y_1 = 8 - \frac85 x_1 + 0 + \frac15 y_3 \\ y_2 = 16 - \frac{16}{5}x_1 - x_3 + \frac25 y_3 \\ g = 12 - \frac15 x_1 - 3x_3 - \frac25 y_3 \end{cases} \]Придружено решење сада је:
\[ x_1 = x_3 = y_3 = 0, \quad x_2 = 6, \quad y_1 = 8, \quad y_2 = 16, \quad g = 12. \]Поступимо ли сада на исти начин, са x2 улазном и овде y1 излазном варијаблом, уврштавајући у горње једначине, добијамо:
\[ \begin{cases} x_2 = 14 - 2x_1 - x_3 - y_1 \\ y_2 = 0 - x_3 + 2y_1 \\ y_2 = -40 + 8x_1 + 5y_1 \\ g = 28 - 3x_1 - 3x_3 - 2y_1 \end{cases} \]Придружено решење имало би y3 = -40, што је нарушавање позитивности! Када се то деси знамо да је негде грешка. У изводивом решењу претходног списка могли смо имати x1 за улазну, а било y1 или y2 за излазну варијаблу. Бирајмо y1 и израчунавамо:
\[ \begin{cases} x_1 = 5 - \frac58 y_1 + \frac18 y_3 \\ x_2 = 4 - x_3 + \frac14 y_1 - \frac14 y_3 \\ y_2 = 0 - x_3 + 2y_1 \\ g = 13 - 3x_2 - \frac18 y_1 - \frac38 y_3 \end{cases} \]У овој листи сви коефицијенти доњег (g) реда су негативни, па их морамо мењати нулама. То значи да смо завршили са програмирањем и оптимална, максимална вредност је g = 13. Придружено решење:
\[ x_3 = y_1 = y_3 = 0, \quad x_1 = 5, \quad x_2 = 4, \quad x_3 = 0; \quad g = 13 \]је коначно, оптимално решење.
2.4. Урадићемо опет исти претходни задатак (2.3) сада симплекс методом помоћу табеле (енг. tableau). Поступак је сличан решавању система линеарних једначина Гаусовом методом елиминације, осим што овде не смемо замењивати места редака табеле. Стандардну форму (1) пишемо:
\[ g = x_1 + 2x_2 - x_3, \] \[ \begin{cases} 2x_1 + x_2 + x_3 \le 14 \\ 4x_1 + 2x_2 + 3x_3 \le 28 \\ 2x_1 + 5x_2 + 5x_3 \le 30 \\ x_1, x_2, x_3 \ge 0 \end{cases} \]Међу релације уводимо помоћне варијабле (2) y1, y2 и y3 и од неједнакости настаје систем једначина, који бисмо могли писати матрично Ax = b. Функцију циља (g) додајемо испод система:
\[ \begin{cases} 2x_1 + x_2 + x_3 + y_1 = 14 \\ 4x_1 + 2x_2 + 3x_3 + y_2 = 28 \\ 2x_1 + 5x_2 + 5x_3 + y_3 = 30 \\ -x_1 - 2x_2 + x_3 + g = 0 \end{cases} \]Подразумевају се услови ненегативности \( x_1, x_2, x_3, y_1, y_2, y_3 \ge 0 \) и креирамо табелу (3):
x1 | x2 | x3 | y1 | y2 | y3 | g | b |
---|---|---|---|---|---|---|---|
Најмању (негативну) вредност у доњем реду има подвучени број (-2). Његова, друга колона (x2) је водећа, а највећи број (5) те је у трећем реду и тај је водећи ред. Водећи ред (a3.) делимо водећим бројем (5) и множимо бројем (aj2 = 1, 2, -2) те колоне да би низ одузели од текућег низа, а резултат уврштавамо у текући низ (aj. - aj2⋅a3./5 → aj.). Тако настаје нова табела:
x1 | x2 | x3 | y1 | y2 | y3 | g | b |
---|---|---|---|---|---|---|---|
Нова водећа колона (x1) је са подвученим бројем (-1/5) у доњем реду. Највећи коефицијент (16/5) те колоне дефинише водећи ред (a2.). Водећи ред делимо највећим бројем и множимо текућим бројем, да би резултате одузимали од текућег реда и уписивали их као нове у текућем реду (aj. - aj1⋅a2.⋅5/16 → aj.):
x1 | x2 | x3 | y1 | y2 | y3 | g | b |
---|---|---|---|---|---|---|---|
Нема више негативних вредности у доњем реду и кружни процес израчунавања симплекс методом је завршен. Оптимална, максимална вредност g = 13 постиже се са x1 = 5, x2 = 4 и x3 = 0.
9. Пример. Урадимо и 8. пример помоћу симплекс табеле. Дате услове пишемо као систем:
\[ \begin{cases} 2x_1 + 4x_2 + y_1 = 24 \\ 4x_1 + 2x_2 + y_2 = 24 \\ x_1, x_2, y_1, y_2 \ge 0 \\ -300x_1 - 500x_2 + g = 0 \end{cases} \]Формирамо прву табелу:
x1 | x2 | y1 | y2 | g | b |
---|---|---|---|---|---|
Водећа колона је друга (x2), а водећи ред први (4 је највећи број) који сав делимо са 4 и множимо бројем водеће колоне актуелног реда да бисмо резултат одузели од актуелног реда. Добијамо другу табелу:
x1 | x2 | y1 | y2 | g | b |
---|---|---|---|---|---|
Водећа колона је прва (x1), а водећи ред други (3 је највећи број) који сав делимо са 3 и множимо бројем водеће колоне актуелног реда и резултат одузимамо од тог реда. Добијамо трећу табелу:
x1 | x2 | y1 | y2 | g | b |
---|---|---|---|---|---|
Резултат је да ће максимална зарада g = 3200 дин бити остварена када стројеви раде x1 = x2 = 4 комада робе дневно. Исто као у геометријском приказу. □
2.5. За програмирање решења у програмском језику Питон, потребно је да имате инсталиран модул cvxopt (ако немате, из Command Prompt позовите python -m pip install cvxopt).
На пример, минимизирати 2x1 + x2 уз услове -x1 + x2 ≤ 1, x1 + x2 ≥ 2, x2 ≥ 0, x1 - 2x2 ≤ 4. Задатак је постављен у Питону лево, а посебно графичко решење је на слици десно:
from cvxopt import matrix, solvers A = matrix([ [-1.0, -1.0, 0.0, 1.0], [1.0, -1.0, -1.0, -2.0] ]) b = matrix([ 1.0, -2.0, 0.0, 4.0 ]) c = matrix([ 2.0, 1.0 ]) sol=solvers.lp(c,A,b)
pcost dcost gap pres dres k/t 0: 2.6471e+00 -7.0588e-01 2e+01 8e-01 2e+00 1e+00 1: 3.0726e+00 2.8437e+00 1e+00 1e-01 2e-01 3e-01 2: 2.4891e+00 2.4808e+00 1e-01 1e-02 2e-02 5e-02 3: 2.4999e+00 2.4998e+00 1e-03 1e-04 2e-04 5e-04 4: 2.5000e+00 2.5000e+00 1e-05 1e-06 2e-06 5e-06 5: 2.5000e+00 2.5000e+00 1e-07 1e-08 2e-08 5e-08 Optimal solution found.
print(sol['x']) [ 5.00e-01] [ 1.50e+00]
На крају тражимо штампање (print) решења, x1 = 0,5 и x2 = 1,5. Дакле, g = 2⋅2,5 + 1,5 = 2,5 је најмања вредност датог збира у захтеваним условима. На посебној слици, горе десно, права 2,5 = 2x1 + x2 садржи угаону тачку (0,5; 1,5) зелено шрафираног ограничења.
Циљана функција g = c1x1 + ... + cnxn линеарног програмирања лако се интерпретира као информација перцепције, јер је сама облика збира производа. Тада вектор c = (c1, ..., cn) можемо сматрати на пример иницијативама објекта, а вектор x = (x1, ..., xn) реакцијама субјекта, под датим ограничењима.
3. Квадратно програмирање
3.1. Квадратно програмирање се разликује од линеарног само по функцији циља
\[ g = \sum_{j=k}^n c_k x_k + \sum_{j,k = 1}^n d_{jk}x_jx_k \]чији максимум/минимум тражимо под истим условима релација (Линеарно прог.). Једнако као пре, те релације допуњавањем ненегативним помоћним варијаблама (yν) биће системи линеарних једначина, матрично Ax = b. Неопходан услов да функција има екстрем је да њени изводи буду нуле:
\[ \frac{\partial g}{\partial x_k} = \sum_{j=1}^n c_j + 2\sum_{j=1}^n d_{jk}x_j = 0, \quad k = 1, 2, ..., n, \]а то су додатна (линеарна) ограничења. У међувремену погледајмо још неке познате начине.
10. Пример. Тражимо максималну вредност квадратне функције, без ограничења:
одакле је g(2, 4) = 16 максимална вредност. Просто речено, постоји глобални максимум јер је функција циља строго конкавна.
На други начин, исти се задатак може решити изједначавањем парцијалних извода нулама:
\[ \frac{\partial g}{\partial x_1} = -4x_1 + 8 = 0, \quad \frac{\partial g}{\partial x_2} = -6x_2 + 24 = 0, \]а отуда x1 = 2 и x2 = 4, а отуда g = 16 максимална вредност. □
11. Пример. Тражимо минималну вредност квадратне функције, са ограничењем:
\[ g(x_1, x_2) = (x_1 - 1)^2 + (x_2 - 1)^2, \] \[ x_1 + x_2 \ge 6. \]Решење: На слици лево је Декартов правоугли координатни систем (Ox1x2) са кружницом средишта S(1, 1) минималног полупречника \(r = 2\sqrt{2}\) која представља циљану функцију g.
Њој је најближа тачка T(3, 3) где је дата гранична права x1 + x2 = 6 тангира. Дужина до те границе је полупречник r = ST, дуж окомита на дату праву.
Према томе, минимално решење овог квадратног програма је циљна функција:
\[ g(3, 3) =(3 - 1)^2 + (3 - 1)^2 = 8. \]Ближе нема куд, а даље није минимум. □
3.2. Непрекидна функција f = f(x) која на неком интервалу расте па опада има (локални) максимум. Њен први извод \( f' = \frac{df}{dx}\) на том интервалу редом је позитиван, нула (у тачки максимум), па негативан, што значи да је то функција чија се вредност смањује. Зато је њен други извод \(f'' = \frac{df'}{dx}\) негативан. Непрекидна функција чији други извод на датом интервалу је негативан има (локални) максимум и испупчена је према горе, тј. конкавна је. Обрнуто, ако је други извод сличне позитиван, функција има (локални) мимнимум и удубљена је, тј, конвексна. Са овим запажањем погледајмо следећи пример квадатног програмирања.
У случају диференцијабилне функције више променљивих, њени други парцијални изводи формирају Хесијанову (Hessian) квадратну матрицу H, чије својствене вредности, ламбда из матричне једначине Hx = λx, говоре о конкавности (λ < 0) и конвексности (λ > 0) функције. Познато је како се иста матрица користи за решавање проблема оптимизације.
12. Пример. Проверити да ли функција g(x1, x2) = 2x1 + 3x2 - x1² - x2² има максимум (минимум).
Решење: Тражимо када је функција g конкавна или конвексна. Налазимо друге изводе:
\[ g'_1 = \frac{\partial g(x_1, x_2)}{\partial x_1} = 2 - 2x_1, \quad g'_2 = \frac{\partial g(x_1, x_2)}{\partial x_2} = 3 - 2x_2, \] \[ g_{11}'' = \frac{\partial g_1}{\partial x_1} = - 2, \quad g''_{12} = g''_{21} = 0, \quad g''_{22} = \frac{\partial g_2}{\partial x_2} = - 2. \]Формирамо Хесијан матрицу ових других извода:
\[ H = \begin{pmatrix} g''_{11} & g''_{12} \\ g''_{21} & g''_{22} \end{pmatrix} = \begin{pmatrix} -2 & 0 \\ 0 & -2 \end{pmatrix}. \]Из матричне једначине Hx = λx налазимо њене својствене вредности λ1 = λ2 = -2. Зато што је ламбда негативно, дати проблем има конкавну циљну функцију g и та функција има максимум. □
3.3. Општи квадратни програм може бити писан матрично:
\[ g(x) = cx + \frac12x^\top H x, \quad Ax \le b, \ x \ge 0, \]где треба минимизирати функцију g више променљивих, x = (x1, ..., xn) са индексом константом n = 1, 2, 3, ..., а c = (c1, ..., cn) је вектор, H је симетрична n×n Хесијан матрица, уз додатне услове једнаке као и у случају линеарног програмирања. Претпостављамо да изводљиво решење постоји и да је област решавања ограничена.
Када је циљна функција g(x) стриктно конвексна за све изводљиве тачке, постоји јединствен локални минимум проблема, који је уједно глобални минимум. Довољан услов за строгу конвексност је да је H позитивно одређенa. Иначе, позитивно дефинитна (одређена) матрица је симетрична матрица чија је свака својствена вредност позитивна.
Даље су потребни Кун-Такерови услови да би решење у нелинеарном програмирању било оптимално. Они су довољни за глобални минимум када је H позитивно одређена; иначе, највише што могу дати је да су неопходни.
Искључујући ненегативне услове, Лагранжова функција за квадратни програм је:
\[ L(x, \mu) = cx + \frac12 x^\top Hx + \mu(Ax - b), \]где је μ вектор са m компоненти. Наводим и Кун-Такерове услове:
\[ \frac{\partial L}{\partial x_j} \ge 0, \ j = 1, ..., n, \quad c + x^\top Q + \mu A \ge 0, \] \[ \frac{\partial L}{\partial \mu_i} \le 0, \ i = 1, ..., m, \quad Ax - b \le 0, \] \[ x_j\frac{\partial L}{\partial x_j} = 0, \quad x^\top(c^\top + Hx + A^\top \mu) = 0. \]13. Пример. Функција g(x1, x2) која се треба минимизирати, уз дате услове:
\[ g(x) = -8x_1 - 16x_2 + x_1^2 + 4x_2^2, \quad x_1 + x_2 \le 5, \ x_1 \le 3, \ x_1 \ge 0, \ x_2 \ge 0. \]матрично писан проблем је:
\[ c = \begin{pmatrix} -8 \\ -16 \end{pmatrix}, \quad H = \begin{pmatrix} 2 & 0 \\ 0 & 8 \end{pmatrix}, \quad A = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix}, \quad b = \begin{pmatrix} 5 \\ 3 \end{pmatrix}. \]Не решавамо га овде, јер ручне методе данас замењују лако доступне компјутерске. □
3.4. Ево примера решавања квадратног проблема Питоном. Стандардни облик квадратних програма писаних матрично за Питон је:
\[ \begin{cases} \text{minimise} & g(x) = \frac12 x^\top H x + c^\top x \\ \text{subject to} & Gx \le h, \ Ax = b \end{cases} \]14. Пример. Минимизирати g = 2x1² + x2² + x1x2 + x1 + x2 у условима x1, x2 ≥ 0 и x1 + x2 = 1.
Решење: У припреми израчунавамо друге изводе да формирамо H и додатне матрице:
\[ H = \begin{pmatrix} 4 & 1 \\ 1 & 2 \end{pmatrix}, \quad c = \begin{pmatrix} 1 \\ 1 \end{pmatrix}, \quad G = \begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix}, \quad h = \begin{pmatrix} 0 \\ 0 \end{pmatrix}, \quad A_{1\times 2} = \begin{pmatrix} 1 & 1 \end{pmatrix}, \quad b = ( 1 ). \]from cvxopt import matrix, solvers H = 2*matrix([ [2, .5], [.5, 1] ]) c = matrix([1.0, 1.0]) G = matrix([[-1.0,0.0],[0.0,-1.0]]) h = matrix([0.0,0.0]) A = matrix([1.0, 1.0], (1,2)) b = matrix(1.0) sol=solvers.qp(H, c, G, h, A, b) pcost dcost gap pres dres 0: 1.8889e+00 7.7778e-01 1e+00 2e-16 2e+00 1: 1.8769e+00 1.8320e+00 4e-02 1e-16 6e-02 2: 1.8750e+00 1.8739e+00 1e-03 2e-16 5e-04 3: 1.8750e+00 1.8750e+00 1e-05 1e-16 5e-06 4: 1.8750e+00 1.8750e+00 1e-07 3e-16 5e-08 Optimal solution found. print(sol['x']) [ 2.50e-01] [ 7.50e-01]
Оптимално решење је g(0,25; 0,75) = 1,875. □
4. Посебне неједнакости
Прва од „посебних“ неједнакости је Јенсенова. Она обухвата неколико мање познатих неједнакости, а названа је по данском математичару Јохану Јенсену, који ју је доказао је 1906. године. Из ње се могу изводити рецимо неједнакости аритметичке и квадратне средине (6. став), Чебишевљева неједнакост, или неједнакост Коши-Шварц-Буњаковског.
4.1. Јенсенова неједнакост генерализује тврдњу да секантна линија конвексне функције лежи изнад криве. На следећој слици је граф конвексне функције f = f(x) и њене две тачке са апсцисама x1 < x2 које спаја секанта, дуж на којој је узета произвољна тачка апсцисе x = λ1x1 + λ2x2, при чему услови λ1, λ2 ≥ 0 и λ1 + λ2 = 1 гарантују да је x1 ≤ x ≤ x2. Очигледно је f(λ1x1 + λ2x2) ≤ λ1f(x1) + λ2f(x2).
Када је f(x) конвексна (удубљена) функција, онда је g(x) = -f(x) конкавна (испупчена), па непосредно из претходне неједнакости следи λ1g(x1) + λ2g(x2) ≤ g(λ1x1 + λ2x2) за конкавне функције.
Реална функција f више варијабли која је на интервалу I два пута диференцијабилна је конвексна ако и само ако f''(x) ≥ 0 за све x ∈ I. Она је на том интервалу конкавна ако и само ако f''(x) ≤ 0 за све x ∈ I.
15. Став Дата је конвексна реална функција f на интервалу I са варијаблама x1, ..., xn ∈ I и константама ω1, ..., ωn ≥ 0. Тада је
\[ f\left(\frac{\omega_1x_1 + ... + \omega_nx_n}{\omega_1 + ... + \omega_n}\right) \le \frac{\omega_1f(x_1) + ... + \omega_nf(x_n)}{\omega_1 + ... + \omega_n}. \]Доказ Нека је збир ω1 + ... + ωn = ω и ставимо λi = ωi/ω, редом за i = 1, ..., n. Тада се проблем своди на доказ неједнакости
\[ f\left(\sum_{i=1}^n \lambda_ix_i\right) \le \sum_{i=1}^n \lambda_i f(x_i). \]У случају n = 1 тврђење је тривијално тачно. Даље доказујемо индукцијом. Нека је:
\[ \mu_i = \frac{\lambda_i}{1 - \lambda_n}, \ i = 1, ..., n-1, \quad \sum_{i=1}^n \mu_i = 1 \]и претпоставимо да је неједнакост тачна за n - 1. Тада је:
\[ \sum_{i=1}^n \lambda_if(x_i) = \left[ \sum_{i=1}^{n-1} (1-\lambda_n)\mu_if(x_i)\right] + \lambda_nf(x_n) \le \] \[ \le (1 - \lambda_n)f\left(\sum_{i=1}^{n-1}\mu_ix_i\right) + \lambda_n f(x_n) \] \[ \le f\left[(1 - \lambda_n)\left(\sum_{i=1}^{n-1} \mu_ix_i \right) + \lambda_nx_n \right] \] \[ = f\left(\sum_{i=1}^n \lambda_i x_i \right). \]То значи да је неједнакост тачна за n. Тиме је став доказан. ∎
4.2. Коши-Шварцова неједнакост спада међу најважније неједнакости у математици. Неједнакост за збирове открио је Огистен Луј Коши (1821), а за интеграле први је доказао Виктор Буњаковски (1859) и независно од њега нешто касније Херман Шварц (1888).
16. Став. У просторима са скаларним производом за све векторе u и v је |⟨u, v⟩|² ≤ ⟨u, u⟩⋅⟨v, v⟩, где ⟨*, *⟩ представља унутрашњи производ вектора. Еквивалентно, ова Коши-Шварцова неједнакост се помоћу норме вектора може писати у облику |⟨u, v⟩| ≤ ∥u∥ ∥v∥. Једнакост важи акко су вектори паралелни.
Доказ: Ако је v = 0 једнакост очигледно важи (нула-вектор је паралелан сваком вектору). Узмимо да је даље v ≠ 0 и нека је
\[ z = u - \frac{\langle u, v\rangle}{\langle v, v\rangle} v. \]Тада је:
\[ \langle z, v\rangle = \left\langle u - \frac{\langle u, v\rangle}{\langle v, v\rangle} v, v \right\rangle = \langle u, v\rangle - \frac{\langle u, v\rangle}{\langle v, v\rangle} \langle v, v\rangle = 0, \]што значи да су вектори z и v узајамно окомити (z⊥v), па можемо применити Питагорину теорему на
\[ u = \frac{\langle u, v\rangle}{\langle v, v\rangle} v + z \]одакле:
\[ \|u\|^2 = \left|\frac{\langle u, v\rangle}{\langle v, v\rangle}\right|^2 \|v\|^2 + \|z\|^2 = \left|\frac{\langle u, v\rangle}{\|v\|^2}\right|^2 \|v\|^2 + \|z\|^2 = \frac{|\langle u, v\rangle|^2}{\|v\|^2} + \|z\|^2 \ge \frac{|\langle u, v\rangle|^2}{\|v\|^2}, \]а отуда ∥u∥ ∥v∥ ≥ ⟨u, v⟩, где једнакост важи акко z = 0, акко су векториu и v линеарно зависни. ∎
Коши-Шварцова неједнакост посебно је занимљива када се скаларни производ интерпретира као информација перцепције. Она \(\vec{u}\cdot\vec{v} \le |\vec{u}||\vec{v}|\) тада каже да узајамна информација (субјекта и објекта) није већа од производа интензитета само-информација (учесника). Другим речима, у опажању објекта, субјекат је увек у нечему закинут.
4.3. Јангову неједнакост (William Henry Young, 1863 – 1942, енглески математичар), која говори о производу два броја, не треба мешати са Јанговом конволуционом неједнакошћу.
17. Став Ако су a, b ≥ 0 и p, q > 1 такви да је 1/p + 1/q = 1, тада је
\[ ab \le \frac{a^p}{p} + \frac{b^q}{q}. \]Једнакост важи ако и само ако ap = bq.
Доказ: Тврђење је очигледно тачно за a = b = 0, па даље претпоставимо a, b > 0. Ставимо t = 1/p, а тада и 1 - t = 1/q. Из тога ln(tap + (1 - t)bq) ≥ t ln(ap) + (1 - t) ln(bq) = ln(a) + ln(b) = ln(ab), јер је логаритамска функција конкавна Јенсенова неједнакост. Отуда Јангова неједнакости где очигледно важи једнакост акко ap = bq. ∎
4.4. Холдерова неједнакост (Otto Hölder, 1859 – 1937, немачки математичар), је основна неједнакост између интеграла и незаобилазно средство за проучавање Lp простора. За реални број p ≥ 1, имамо p-норму, или Lp-норму, вектора x = (x1, ..., xn) дефинисану са ∥x∥p = (∥x1∥p + ... + ∥xn∥p)1/p. Еуклидска норма овде је 2-норма, а 1-норма одговара праволинијском растојању. Када p → ∞, норма L∞ постаје ∥x∥∞ = max {|x1|, ..., |xn|}. Може се показати да ... ≤ ∥x∥p ≤ ... ≤ ∥x∥2 ≤ ∥x∥1.
Када је S мерљив подскуп ℝn са Лебеговом мером, а f и g су функције са реалним или комплексним променљивим на S, тада Холдерову неједнакост пишемо
\[ \int_S |f(x)g(x)|\ dx \le \left(\int_S |f(x)|^p\ dx\right)^{1/p}\left(\int_S |g(x)|^q \ dx\right)^{1/q}. \]У случају n-торки реалних или комплексних бројева, Холдерова неједнакост је
\[ \sum_{k=1}^n |x_ky_k| \le \left(\sum_{k=1}^n |x_k|^p\right)^{1/p}\left(\sum_{k=1}|y_k|^q\right)^{1/q}. \]У простору вероватноћа \( (\Omega, \mathcal{F}, \mathbb{P}) \) је 𝔼 оператор очекивања. За реалне или комплексне варијабле X и Y на Ω Холдерова неједнакост је
\[ \mathbb{E}[|XY|] \le \left(\mathbb{E}[|X|^p]\right)^{1/p}\left(\mathbb{E}[|Y|^q]\right)^{1/q}. \]18. Став. Ако су p, q ∈ [1, ∞] са 1/p + 1/q = 1, у мерљивом простору, тада за све мерљиве реалне или комплексне функције f и g важи неједнакост ∥fg∥1 ≤ ∥f∥p ∥g∥q.
Доказ: Делећи f и g са ∥f∥p и ∥g∥q редом, добијамо ∥f∥p = ∥g∥q = 1. Даље користимо Јангову неједнакост за производ два броја. Тако је
\[ |f(x)g(x)| \le \frac{|f(x)|^p}{p} + \frac{|g(x)|^q}{q}. \]Интегралећи (сабирајући) претходне неједнакости, добијамо:
\[ \|fg\|_1 \le \frac{\|f\|_p^p}{p} + \frac{\|g\|_q^q}{q} = \frac{1}{p} + \frac{1}{q} = 1. \]Отуда тврђење. ∎
Детаљније, мало другачије, овај и још неке доказе имате и у књизи Квантна Механика (1.3.1 Метрички простор, Теорема 1.3.3). Бројеви p и q које она користи су један другом коњугати Холдера. Специјалан случај p = q = 2 своди је на претходну Коши-Шварцову неједнакост. Холдерова неједнакост важи чак и ако је ‖fg‖1 бесконачан, када је бесконачна и десна страна. Обрнуто, са f у Lp, а g у Lq, постаје fg тачкасти производ у L1.
4.5. Неједнакост Минковског (Hermann Minkowski, 1864 – 1909, немачки математичар) утврђује да су Lp простори нормирани векторски простори. Када је S мерљив подпростор ℝn, са 1 ≤ p < ∞, а функције f и g елементи тог простора, тада је f + g такође елеменат тог простора и важи неједнакост троугла
са једнакошћу ако и само ако су функције f и g позитивно линеарно зависне, што ће бити једино када је f = λg за неко λ ≥ 0 или g = 0. Овде се норма задаје са
\[ \|f\|_p = \left( \int_S |f(t)|^p \ dt \right)^{1/p}. \]Када p → ∞, онда ова норма постаје есенцијални супремум
Ово се даље прецизира и поопштава. У књизи Квантна Механика (1.3.1 Метрички простор, Теорема 1.3.4) наћи ћете доказ Минковскијеве неједнакости за p ∈ [1, ∞] у мерљивом простору, да за све реалне или комплексне n-торке бројева из S важи
\[ \left( \sum_{k=1}^n |x_k + y_k|^p \right)^{1/p} \le \left( \sum_{k=1}^n |x_k|^p \right)^{1/p} + \left( \sum_{k=1}^n |y_k|^p \right)^{1/p} \]са једнакошћу акко су низови x = (x1, ..., xn) и y = (y1, ..., yn) позитивно линеарно зависни, што значи када је x = λy за неко λ ≥ 0 или је y низ нула. Даље погледајмо аналогно томе у случају интеграбилних функција.
19. Став. Ако је p ∈ [1, ∞] у мерљивом простору, тада за све мерљиве реалне или комплексне интеграбилне функције f и g важи неједнакост
\[ \left( \int_S |f(t) + g(t)|^p \ dt \right)^{1/p} \le \left( \int_S |f(t)|^p \ dt \right)^{1/p} + \left( \int_S |g(t)|^p \ dt \right)^{1/p} \]са једнакошћу акко су функције f и g позитивно линеарно зависне.
Доказ: Прво погледајмо да збир f + g има коначну p-норму, ако је обе функције имају, што следи из:
\[ |f + g|^p \le 2^{p-1}(|f|^p + |g|^p), \]Ово је тачно, јер је \( h(x) = |x|^p \) конвексна над ℝ+ за p > 1. Наиме, због дефиниције конвексности
\[ |\frac12f + \frac12g|^p \le \frac12|f|^p + \frac12|g|^p, \]па је онда:
\[ |f + g|^p \le \frac12|2f|^p + \frac12|2g|^p = 2^{p-1}|f| + 2^{p-1}|g|. \]Дакле, имамо коначну p-норму. Ако је она нула, Минковскијева неједнакост тривијално важи, па даље претпоставимо да та норма, ∥f + g∥p, није нула. Користећи неједнакост троугла па Холдерову, имамо:
\[ \|f + g\|_p^p = \int |f+g|^p \ dt = \int |f + g|\cdot |f + g|^{p-1} \ dt \le \] \[ \le \int (|f| + |g|)|f + g|^{p-1} \ dt = \int |f||f + g|^{p-1} \ dt + \int |g||f + g|^{p-1} \ dt \] \[ \le \left( \left(\int |f|^p \ dt \right)^\frac{1}{p} + \left( \int |g|^q \ dt \right)^\frac{1}{q} \right)\left( \int |f + g|^{(p-1)\frac{p}{p-1}} \ dt \right)^{1-\frac{1}{p}} \] \[ = (\|f\|_p + \|g\|_p)\frac{\|f+g\|_p^p}{\|f+g\|_p}. \]Из овога следи тражена неједнакост. ∎
4.6. Бернулијева неједнакост. Јакоб из чувене породице швајцарских математичара (Jacob Bernoulli, 1655 - 1705) открио је по њему названу неједнакост
која се лако доказује и често користи.
Доказ: У првом кораку математичке индукције закључујемо да је Бернулијева релација (очигледно) тачна када n = 1. У другом кораку индукције, претпостављамо да је тачна и за неко n, па доказујемо тачност за n + 1:
а отуда та Бернулијева неједнакост. ∎
За n > 1, или x ≠ 0, последња релација је строга неједнакост, па видимо да важи једнакост акко n = 1 или x = 0. Бернулијева неједнакост се лако поопштава на све реалне бројеве n ≥ 1 и све x ≥ -1.
4.7. Неједнакост p-норми. У простору реалних ℝn, или комплексних ℂn низова, n-торки задаје се p-норма низа x = (ξ1, ξ2, ..., ξn) једнакошћу:
\[ \|x\|_p = \left(|\xi_1|^p + |\xi_2|^p + ... + |\xi_n|^p\right)^{1/p}. \]Показаћемо да је ∥⋅∥p опадајућа функција по p, за p ∈ (0, ∞), а погледајте и примене (Lp spaces).
20. Став. За (продужени) реални број 1 ≤ p ≤ ∞ и константан низ x = (ξ1, ξ2, ..., ξn), пресликавање:
\[ p \to \|x\|_p = \left(\sum_{k=1}^n |\xi_k|^p\right)^{1/p} \]је монотоно опадајуће. Другим речима, из p > r ≥ 1 следи ∥x∥p ≤ ∥x∥r.
Доказ: Ако је α1, α2, ..., αn низ позитивних реалних бројева и 0 < m < 1, онда је:
\[ \left(\sum_{k=1}^n \alpha_k\right)^m \le \sum_{k=1}^n \alpha_k^m. \]То се лако проверава. Отуда, ако је p > r ≥ 1, односно 0 < r/p < 1, стављајући m = r/p и αk = |ξk|p, биће:
\[ \left(\sum_{k=1}^n |\xi_k|^p\right)^{r/p} \le \sum_{k=1}^n |\xi_k|^p, \]а отуда тражени резултат. ∎
У просторима ℓp бесконачних конвергентних низова (1.11. Примери) не важе неједнакости ставова који следе, али важе строге инклузије ℓ1 ⊂ ℓp ⊂ ℓr ⊂ ℓ∞ када 1 < p < r < ∞ и претходна неједнакост ∥x∥r < ∥x∥p.
21. Став. Важи неједнакост ∥x∥1 ≤ ∥x∥2√(n) за низове x ∈ ℂn.
Доказ: Користимо Коши-Шварцову неједнакост:
\[ \|x\|_1 = \sum_{k=1}^n |\xi_k| = \sum_{k=1}^n 1\cdot |\xi_k| \le \left(\sum_{k=1}^n 1^2\right)^{1/2} \left(\sum_{k=1}^n |\xi_k|^2\right)^{1/2} = \sqrt{n}\|x\|_2. \]Тиме је доказ за низове x = (ξ1, ξ2, ..., ξn) ∈ ℝn завршен. ∎
22. Став. Када је 1 ≤ p ≤ r ≤ ∞ важи неједнакост ∥x∥p ≤ ∥x∥r n1/p - 1/r за низове x ∈ ℂn.
Доказ: Користимо Холдерову неједнакост за низове x = (ξ1, ξ2, ..., ξn):
\[ \sum_{k=1}^n |a_k||b_k| \le \left(\sum_{k=1}^n |a_k|^s\right)^{\frac{1}{s}} \left(\sum_{k=1}^n |b_k|^{\frac{s}{s-1}}\right)^{1-\frac{1}{s}}. \]Применимо је на |ak| = |ξk|p, |bk| = 1 и s = r/p > 1, редом:
\[ \sum_{k=1}^n |\xi_k|^p = \sum_{k=1}^n |\xi_k|^p \cdot 1 \le \left(\sum_{k=1}^n (|\xi_k|^p)^{\frac{p}{r}}\right)^{\frac{p}{r}} \left(\sum_{k=1}^n 1^{\frac{r}{r-p}}\right)^{1-\frac{p}{r}} = \left(\sum_{k=1}^n |\xi_k|^r\right)^{\frac{p}{r}}n^{1-\frac{p}{r}}. \]Отуда:
\[ \left(\sum_{k=1}^n |\xi_k|^p\right)^{\frac{1}{p}} \le \left(\left(\sum_{k=1}^n|\xi_k|^r\right)^{\frac{p}{r}}n^{1-\frac{p}{r}}\right)^{\frac{1}{p}} = \left(\sum_{k=1}^n |\xi_k|^r\right)^{\frac{1}{r}} n^{\frac{1}{p}-\frac{1}{r}}, \] \[ \|x\|_p \le n^{1/p - 1/r}\|x\|_r, \quad r \gt p. \]Ово c = n1/p - 1/r je najбоља могућа константа. Тиме је доказ завршен. ∎
Уопште биће ∥x∥2 ≤ ∥x∥1 ≤ √(n) ∥x∥2 и ∥x∥p ≤ ∥x∥r ≤ n1/r - 1/p ∥x∥p када 1 ≤ r < p. Ако користимо Холдерову неједнакост за интеграбилне функције f(x) на домену x ∈ S, рецимо, коначном интервалу S = I = (a, b), претходни став даје ∥f∥p ≤ |S|1/p - 1/r ∥f∥r аналогним поступком доказивања. То је неједнакост p-норми за Lp(S) просторе, поред општег ∥x∥p ≤ ∥x∥r када 1 ≤ r < p.