Previous

Август 2024 (English ≽)

Next



Avoidance

Питање: Може ли „седласта тачка“ водити у пораз и шта онда?

Avoidance

Одговор: Наравно. Ево када се то догађа у случају класичне теорије игара (Equilibrium II). Нека је:

I \ II A B
A -2 -3
B 1 2

табела плаћања. Када I играч бира потез A, а II играч такође свој потез A, први губи 2 бода. Ако тада II игра потез B, први ће губити 3.

Међутим, када I играч изабере потез B, онда II играч губи у оба случаја, у случају да вуче A губи 1 бод, а ако повуче потез B губи 2 бода. Нема спаса од седласте тачке (1, на позицији B-A), јер други играч губи док год први игра B. Зато II треба избегавати ову игру, а I могао покушати да га у игри задржи. Методе таквог заваравања, завлачења противника у неповољној стратегији постоје (Sneaking) и, свесни ми тога или не, користимо их.

Тако стоје ствари са мањим бројем потеза када их све можемо сагледати. За разлику од таквих, постоје сложене игре (војне, политичке, тржишне), када има превише потеза, или премало времена, када само процењујемо шта би био наш могући потез који би онемогућио противников најбољи потез. Тада се чешће служимо стратегијама обесхрабривања, завлачења, навлачења у апатију или толеранцију опонента, свачега за успостављање боље позиције. Тако настаје и додатна тешкоћа (в. следећу табелу).

I \ II A1 A2 ... Ak ...
A1 a11 a12 ... a1k ...
A2 a21 a22 ... a2k ...
... ... ... ... ... ...
Ai ai1 ai2 ... aik ...
... ... ... ... ... ...

Чак и када се I играчу учини да је најбоље играти Ai, обзиром на низ aik могућих добитака II играча, он не може бити сасвим сигуран да унутар таквог не постоји за њега непријатно изненађење. То је проблем вишка потеза, односно мањка времена, или мањка знања. Заправо, вероватно дуги низови, попут ai1, ai2, ai3, ..., крију изненађења и храброст се често исплати. Из искуства знамо да „без ризика нема профита“.

Подизањем виталности игре повећава се ова „количина опција“ која би оправдала ризик, а она расте са збиром производа, те са информацијом перцепције. Ствар је у томе да је лакше знати како повећати виталност надметања (узвраћањем), од знања свих могућих одговора противника, чиме бисмо му отежавали посао, повећали му могућност грешке, или га обесхрабрили у наставку игре.

У вишедимензионалној игри, за разлику од шаха и још једноставнијих, на најбољи потез, на низ Ai = (aik), противник нам може наместити низ (bj) могућности одговарајућих његовим капацитетима, тако да се збир:

Si = ai1b1 + ai2b2 + ... + aikbk + ...

смањи. Позитивном коефицијенту (aik) подметнути неки негативан (bk), или обрнуто, негативном позитиван, тако да на „добро“ ударимо „злим“, или на „зло“ узвратимо „добрим“.

Такође, може се и са пренагљивањем (са превише „доброг“ на „добро“, или превише „зла“ на „зло“) умањити информација перцепције (Si) и ниво наше игре. У свим тим случајевима испада да смо промашили са оптималним одговором, што резултира слабијим мајсторством потом опадањем постигнућа, а можда и губитком партије. А све даље су они детаљи које сам раније објашњавао.

Interactions

Питање: Посматрате ли то „игру“ и као играча, а не само као објекте или вањску тему при игрању?

Interactions

Одговор: Добро запажање! Веома сложене игре мењају противнике на видљивије начине, оне постају значајне интеракције учесника. А и иначе, физичке информације и дејства су еквиваленти (у оквиру теорије). Свака ова информација макар мало мења стварност, а ти који се играју, витални субјекти, информације имају у вишку.

Привлачећи „добро“ и одбијајући „зло“, игра стратегије виталности више лиге (Win Lose), неће само премештати играча у „добро“ окружење, него ће мењати и само окружење. У квантној механици (Summation) чин мерења размена је информација, предмета мерења и мерних уређаја. Тај прелаз информације је одузимање неизвесности претходном стању чиме се оно додефинише. Опажањем електрона формира се његова претходна путања — тврдио је Хајзенберг у свађама оснивача квантне механике — а то не значи да „Месец не постоји када га не гледамо“ (Ајнштајн наведени став оспоравајући), јер „опажање је постојање“ (кажемо овде). Месец има ко или шта да „опажа“ чак и када многи од нас то не чине.

Пишем са наводницима „опажање“, јер је поента ове теорије, у једначењу комуникације и интеракције, још увек шире непозната. Нека буде мањак неизвесности емисијом информације и додефинисање путање електрона до даљње дискутабилно тумачење микросвета, до прихватања ове теорије у физици, ми ипак виђамо деловања комуникације на људе или околину око нас — као да се ради о правим физичким интеракцијама.

Зато је у сложеним, вишедимензионалним играма, нереално посматрати играча одвојено од игре, као шахисту од шаховских фигура, јер он је и то што игра, начин на који игра (Traits), а онда и резултат игре. Све то мање или више. Макар нам ове промене изгледале неприметне оне постоје, а и информација перцепције Si = ai1b1 + ai2b2 + ... + aikbk + ... их бележи.

Binary Example

Питање: Можете ли ми детаљно, кроз један лаган пример, провући овај концепт информације перцепције?

Binary Example

Одговор: Да, а надам се да нећу оптеретити блог математиком. На пример, проста стохастичка матрица, какву користи Марков ланац:

\[ M = \begin{pmatrix} 0,7 & 0,6 \\ 0,3 & 0,4 \end{pmatrix}, \]

има седласту тачку 0,6 на месту (1,2). Најмањи бројеви првог и другог ретка су 0,6 и 0,3 док је највећи од њих 0,6. Колоне ове матрице су расподеле вероватноћа (јер је стохастичка), а ретци то нису и имамо гомилање већих бројева у првом ретку због седла.

У једначини q = Mp, која M: pq пресликава бинарну расподелу p у q:

\[ \begin{pmatrix} 0,7 & 0,6 \\ 0,3 & 0,4 \end{pmatrix} \begin{pmatrix} 0,5 \\ 0,5 \end{pmatrix} = \begin{pmatrix} 0,7\cdot 0,5 + 0,6\cdot 0,5 \\ 0,3\cdot 0,5 + 0,4\cdot 0,5 \end{pmatrix} = \begin{pmatrix} 0,65 \\ 0,35 \end{pmatrix} \]

видимо лагано повећање горњег броја резултата. Међутим, горњи не иде превише, јер исти коефицијент 0,6 тада делује на мањи доњи број, па је:

\[ \begin{pmatrix} 0,7 & 0,6 \\ 0,3 & 0,4 \end{pmatrix} \begin{pmatrix} 0,8 \\ 0,2 \end{pmatrix} = \begin{pmatrix} 0,7\cdot 0,8 + 0,6\cdot 0,2 \\ 0,3\cdot 0,8 + 0,4\cdot 0,2 \end{pmatrix} = \begin{pmatrix} 0,68 \\ 0,32 \end{pmatrix} \]

и нема претеривања. Матрица M у каскадном пресликавању конвергира „црној кутији“, M(M(...M)...)pM0p, као што је то углавном са ланцима Маркова. Ево једног од начина како ову M0 израчунати.

У изразу M = PDP-1 (Дијагонализација), односно:

\[ \begin{pmatrix} 0,7 & 0,6 \\ 0,3 & 0,4 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & 0,1 \end{pmatrix} \begin{pmatrix} \frac13 & \frac13 \\ \frac13 & -\frac23 \end{pmatrix}, \]

у помоћној матрици P[v1, v2] колоне су својствени вектори v1 и v2 који припадају редом својственим вредностима λ1 = 1 и λ2 = 0,1 које су, пак, дијагонални елемнти матрице D. Матрица P-1 је инверзна помоћној P. Проверите да је заиста Mvk = λkvk, за оба k = 1, 2. Такође, да је производ PP-1 = I, једнак јединичној матрици и, наравно, да је горњи производ тачан.

Из наведеног израза следи Mn = PDnP-1, редом за све n = 1, 2, 3, ..., па:

\[ \begin{pmatrix} 0,7 & 0,6 \\ 0,3 & 0,4 \end{pmatrix}^n \to \begin{pmatrix} 2 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} \frac13 & \frac13 \\ \frac13 & -\frac23 \end{pmatrix} = \begin{pmatrix} \frac23 & \frac23 \\ \frac13 & \frac13 \end{pmatrix}, \]

када n → ∞. Ова на крају, гранична матрица, је црна кутија M0. Она сваки вектор расподеле трансформише у расподелу (2/3, 1/3), тако да на основу излаза не можемо знати шта је био улаз.

Уопште, редак стохастичке матрице где је њена седласта тачка, је редак и коефицијент излазног вектора расподеле који ће тежити неком већем од броја 0,5. То повећање вероватноће датог ретка или ефекат информације перцепције опонент може покушати избегавати, што је разматрано кроз претходна два одговора. Успе ли му, нападач ће промашити оптимуме и са погрешним реципроцитетом слабити игру. Међутим, ограничења код расподела вероватноћа не остављају много маневарског простора за ово.

Могућности бирања по правилу расту са усложњавањем система, игре. Те још појачава виталност (количина опција) играча, поседовање које зато и чини различитим домете различитих индивидуа.

Binary Example II

Питање: Како би изгледало поопштење овог „Бинарног Примера“?

Одговор: Да бисмо имали бинарну стохастичку матрицу и седласту тачку на позицији (1, 2), карика Марковљевог ланца биће:

\[ M = \begin{pmatrix} a & b \\ 1-a & 1-b \end{pmatrix}, \]

где је 0,5 < b < a < 1. Својствене вредности су су решења Mv = λv, односно (M - λI)v = 0, што значи да је ова детерминанта нула:

\[ \begin{vmatrix} a-\lambda & b \\ 1-a & 1-b - \lambda \end{vmatrix} = 0. \]

Одмах видимо два решења, λ1 = 1 и λ2 = a - b, јер детерминанта је нула када су две колоне пропорционалне. Враћајући ове ламбде у својствену једначину налазимо одговарајуће својствене векторе v1 = (b, 1 - a) као и v2 = (1, -1). Отуда једначина дијагонализације M = PDP-1, односно:

\[ \begin{pmatrix} a & b \\ 1-a & 1-b \end{pmatrix} = \begin{pmatrix} b & 1 \\ 1 - a & -1 \end{pmatrix} \cdot \begin{pmatrix} 1 & 0 \\ 0 & a - b \end{pmatrix} \cdot \frac{1}{1 + b - a}\begin{pmatrix} 1 & 1 \\ 1 - a & a \end{pmatrix}, \]

што је лако проверити непосредним множењем. Колоне матрице P су својствени вектори матирце M, на дијагонали матрице D су својствене вредности, а матрица P-1 је инверзна P. Даље имамо Mn = PDnP-1 за све експоненте n = 1, 2, 3, ..., па:

\[ \begin{pmatrix} a & b \\ 1-a & 1-b \end{pmatrix}^n \to \begin{pmatrix} b & 1 \\ 1 - a & -1 \end{pmatrix} \cdot \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \cdot \frac{1}{1 + b - a}\begin{pmatrix} 1 & 1 \\ 1 - a & a \end{pmatrix}, \]

када n → ∞, јер је 0 < a - b < 0,5 и (a - b)n → 0. Отуда:

\[ M^n \to \frac{1}{1+b-a}\begin{pmatrix} b & b \\ 1 - a & 1 - a \end{pmatrix} = M_0 \]

а за проверу упоредимо ово општије решење са претходним конкретним. Тада је a = 0,7; b = 0,6; 1 + b - a = 0,9 и сви ови резултати даље су исти као и претходни.

Поновићу још једном, домети „информације перцепције“ пре свега су у Раселовом парадоксу (нема скупа свих скупова), у Геделовој теореми (нема теорије свих теорија) и објективности неизвесности, а то се тек у назнакама види у овим превише једноставним примерима.

Dominance

Питање: Шта је то „стратешка доминација“?

Dominance

Одговор: Стратешка доминација теорије игара је ситуација када је једна стратегија најбоља играчу, без обзира на игру противника. Слабо доминантна стратегија је она која никада није испод неке друге стратегије, а истовремено постоји бар нека комбинација и друга стратегија истих исплата.

1. Замислимо две фирме, I и II, које се допуњавају заједничким пројектима, али могу радити и одвојено, са другим понуђачем. Рецимо зидање са унутрашњим уређењем, такође производње и доставе роба, пројектовање софтвера и набавка хардвера, или слично. Бирањем послова не могу знати шта ће друга, али имају процене табеле исплата, као на пример:

I \ II A B
A 5; 5 4; 2
B 2; 4 3; 3

Ако обе фирме склопе poсао са понуђачем A, обе ће зарадити 5 новчаних јединица. Ако обе бирају понуђача B зарада је обе по 3 мерних јединица. Међутим, ако прва оде код A, а друга код B, тада са другим сарадницима зарада прве биће 4, а друге 2 новчана износа. Обрнуто је ако прва оде за B, а друга код A понуђача, када је зарада прве 2, а друге 4. Предвидљиво је да би те две фирме требале сарађивати код заједничког понуђача A.

Доминантна стратегија првог је (A, A). То је стратегија акције коју играч треба предузети без обзира на потезе других играча; најбољи одговор на све могуће акције противника. Исто (A, A) је и Нешова равнотежа (Nash Equilibria), избор којим ниједан играч нема подстицај да промени своје понашање, обзиром на стратегију акције другог играча; најбољи могући избор свакој од страна.

2. Претходни пример очигледно није матрица нултог збира, као рецимо матрица игре Роса-Колин, или следећа такође матрица нултог збира:

Dominance b

Налазимо да је C-B (Роса C, Колин B) посебна и најопрезнија стратегија. Играјући C Роса осигурава најмање 2 бода без обзира шта Колин уради. Слично, Колин играјући B сигурно неће изгубити више од 2, па ниједан играч нема никакав подстицај да промени своју стратегију. По томе она је Нешов еквилибријум. Она је и седласта тачка, јер је за Росу максимум минимума врста, а за Колина је минимум његових стубних максимума.

Такође, кажемо да је C доминантна стратегија за Росу, а B је доминантна стратегија за Колина. Матрична игра нулте суме има седласту тачку, ако је исход минимум у свом реду и максимум у својој колони. Ако матрична игра има седласту тачку, оба играча је требају одиграти, али рационалан играч уопште избегаваће доминантне стратегије, јер такве ограничавају маневре. Понављајући ову, Колин ће стално губити по 2 бода.

3. Одличан пример теорије игара, дилему затвореника развили су 1950. математичари корпорације РАНД, Мерил Флод (Merrill Flood) и Мелвил Дрешер (Melvin Dresher), током Хладног рата, а мало касније јој име дао теоретичар игара Алберт Такер (Albert W. Tucker). Неки су спекулисали да је „затвореничка дилема“ направљена да симулира стратегију сукоба између САД-а и СССР-а током Хладног рата.

Дилема затвореника представља ситуацију у којој две стране, раздвојене и онемогућене да комуницирају, морају да бирају да ли ће сарађивати са другом или не. Највећа награда свакој од страна долази ако обе изаберу да сарађују. Класична интерпретација је следећа.

I \ II Признање Негирање
Признање -10; -10 -1; -25
Негирање -25; -1 -3; -3

Двојица пљачкаша банака, I и II, ухапшени су и испитују се у одвојеним просторијама. Власти немају других сведока и могу доказати дело против њих само ако успеју да убеде бар једног од разбојника да изда оног другог и сведочи о злочину. Сваки од пљачкаша је суочен са избором да сарађује са својим саучесником и да ћути или да пребегне из савеза са признањем у тужилаштву.

Ако они сарађују и ћуте, оба негирају кривицу, онда ће их власти судити само по мањој оптужби и добиће сваки по три године затвора. Ако један сведочи, а други не, онда ће онај који сведочи имати само годину, други 25 година казне. Међутим, ако обојица сведоче против другог, сваки ће добити по 10 година затвора јер је делимично одговоран за пљачку.

Сарадња ћутањем је доминантна стратегија за тужене сумљивце и тиме (Негирање, Негирање) је обострано доминантна стратегија која им даје вектор исплате (-3,-3). Она таква није и Парето ефикасна, јер не може се рећи да изласком само појединца добит расте, док истовремено другима не опада.

4. Доминантна стратегија усмерава играча ка победи/поразу и стога игри даје нижу виталност. У случају еквилибријума (равнотеже), када је таква најповољније што има сваки од играча, било да се ради о потезима према његовом највећем успеху, или о избегавању већег неуспеха, она је појава обостраног вртлога. Даљи узрок увлачења тада видимо у начелној тежњи мањој информацији, мањој слободи (количини опција) и уређености као општој космичкој појави.

Без виталности (вишак слобода у односу на физичко тело) нема игре, али природа спонтано тежи мањим слободама (минимализам) па „стратешке доминације“ можемо видети као својеврсне анти-игре. Ова „доминација“ је попут слепе тит-фор-тат стратегије (без изненађења) и добра је ако сте страна која побеђује, али из које треба бежати рецимо са жртвом ако сте страна која губи.

Mixed

Питање: Од чега се састоји „мешана стратегија“?

Mixed

Одговор: Практично, мешана је стратегија свака од „насумичне“ игре па све до неке „стратешке доминације“. То зато што игре припадају виталним, онима са даром вишка опција, поређено мртвом физичком супстанцом, уједно и проклетством чињења грешки, односно немогућности тачног слеђења дате расподеле. Појаснићу ово на примеру игре „Папир, камен, маказе“.

Играчи изненада показују своју шаку. Онај ко је открио песницу (камен) побеђује онога ко изнесе кажипрст и средњи прст (маказе), а губи од испружене шаке (папир), јер камен ломи маказе а папир прекрива камен. Матрица игре је следећа:

I \ II Папир Камен Маказе
Папир 0 1 -1
Камен -1 0 1
Маказе 1 -1 0

Апстраховано ми сматрамо да су шансе показивања папира, камена, или маказа — једнаке. Међутим, практично, увек ћемо бар малко промашити очекивања, па онај ко је чешћи са каменом полако губи од учесталијег са папиром, а полако побеђује чешћег са маказама. Задата је „насумична“ а игра је ипак мање или више „доминантна“.

Ако особа напамет покушава симулирати исходе расподеле вероватноћа, она мора погодити средњу вредност и дисперзију, што је скоро обавезно немогуће. Помислите само како је тешко тако нагађати кривину Гаусовог звона, да разумемо зашто напамет генерисани „случајни“ догађаји скоро увек падају на тесту случајности. То користимо у тестирању децимала да проверимо ирационалност наводно ирационалног броја, да проверимо исправност књиговодства у условима када и не познајемо методологију фирме, или да проверимо поштење лото организатора. Оно ће учинити фаворитима, или лузерима, играче у играма где их не би требало бити.

Статистичка истраживања показују, на пример, да момци у игри „папир, камен, маказе“ преферирају „камен“ (35.4%), а да девојке чешће почињу серију „маказама“. Да и та игра има успешне стратегије одавно знамо, а овде само додајемо понеко зашто или како. Већа склоност виталних ка непредвидљивим грешкама формира њихов траг, јединственост и даје опоненту могућност стратешке доминације.

Описана игра је необичан пример нетранзитивности релације поретка (Chasing tail), па иза тога још један начин објашњења постојања пакета информације противно начелу њеног минимализма. Овде се показао за згодан пример матричне игре без седласте тачке, за парадоксалан однос виталности и неизвесности, али он није и најпростији пример мешаних стратегија какви се налазе свукуда. Следећи је једноставнији, али зато и досадан играчима.

На пример, два играча држе новчић на длану и ако оба показују једнако (глава-глава, или писмо-писмо) поен добија први, а када новчићи нису исти (глава-писмо, писмо-глава) поен добија други играч. Ова се може играти без воље играча, помоћу генератора случајних бројева, а тада је пример праве насумичне игре и, наравно, матричне игре без седласте тачке.

Grizzly

Питање: Шта подразумевате под „релативним успехом“?

Grizzly

Одговор: Знате ли за онај виц о двојици које је загањао гризли. Први тугује: „Не вреди бежати, он је бржи од нас!“, а други му трчећи одговара: „Грешиш, не морам ја бити брз као медвед, довољно ми је да сам бржи од тебе!“. Прича описује суштину турнира чији коначни резултат чине збирови поена појединих партија и осликава „релативни успех“.

Израчунавање стратегија своди се на баждарења коефицијената матрице игре разликама добити другог bik од првог aik играча, на бројеве aik - bik = sik. Стратегије (првог играча) су врсте S1, S2, S3, ..., Sm, а даље вектори, или у примени „стања“, рецимо стања игре или партија.

Док гледамо следећу, општу табелу, приметимо да матрица игре „нултог збира“ има ове коефицијенте облика sik = 2aik, јер је свако aik = bik. Осим тога, најбоље стратегије (првог играча) тражимо међу оним векторима Si (i = 1, 2, ..., m) чији су сви коефицијенти sik, за k = 1, 2, ..., n, позитивни.

I \ II Q1 Q2 ... Qn
S1 a11 - b11 a12 - b12 ... a1n - b1n
S2 a21 - b21 a22 - b22 ... a2n - b2n
... ... ... ... ...
Sm am1 - bm1 am2 - bm2 ... amn - bmn

Тако проширена табела Роса-Колин (Dominance, 2) постаје:

I \ II Q1 Q2 Q3 Q4
S1 24 -2 2 0
S2 10 2 14 -40
S3 6 4 8 6
S4 -32 0 0 32

Табела приказује S3 као најбољу од четири стратегије, јер су једино њој сви коефицијенти позитивни. У случају оптималне стратегије, на начин претходне седласте тачке, бирамо:

\[ s_i = \min \{s_{i1}, s_{i1}, ..., s_{in}\}, \quad s_{ik} = \max \{s_1, s_2, ..., s_m\} \]

и, ако таква постоји, добијамо вредност sik на позицији (i, k) дате табеле. У проширеној табели Роса-Колин, минимуми врста су s12 = -2, s24 = -40, s32 = 4 и s41 = -32, а највећи од ових је управо други члан стратегије S3.

Замислимо сада игру са превише комбинација у којима опонентни имају премало времена, или из других разлога нису у стању да их све сагледају пре одговора. Нека у датом тренутку (први играч) узвраћа јединственим потезом, вектором u = (u1, u2, ..., un), тада је S1 једнако добра стратегија, матрице Росе-Колин, као и S3, јер даје исти збир разлика (24) бодова на једнаке шансе узвратних потеза опонента.

Рећи ћемо, две стратегије, Si и Sj , су једнако „релативно успешне“ у датој игри, када имају једнаке збирове коефицијената, када је:

zi = si1 + si2 + ... + sin = sj1 + sj2 + ... + sjn = zj.

Када је zi < zj, тада можемо рећи да је стратегија Si „релативно лошија“ од стратегије Sj. Смисао са „гризлијем“, ове методе израчунавања стратегија, видим не само у сложеним играма, него и у турнирима где се вишеструко понављају и сабирају како грешке тако и успеси учесника кроз партије.

Теоријски, број стратегија Si и број коефицијената sik може неограничено расти (m, n → ∞), али исто практично забрањује Борељ-Кантелијева лема која каже да је највише коначно много њих тада релевантних. У реалним сложеним условима обично има смисла фокусирати се на један још мањи скуп могућности и припремити одговоре попут u' = (u1, u2, ..., up) за такве пробране ситуације, а остале коефицијенте тог низа допунити нулама.

Тада збир производа siu = si1u1 + si2u2 + ... + sipup постаје један пример, сада информације перцепције игре. Како игра постаје занимљивија, или напорнија и виталнија, ови коефицијенти, sij и uj, прелазе у променљиве величине. Штавише, мењају се и парови одговарајућих производа и број сабирака, јер сходно теорији хаоса постоји могућност одједном снажног утицаја претходно занемарљивог коефицијента.

Defiance

Питање: Зашто игру сматрате изразом виталности?

Defiance

Одговор: Они делови „игре“ чине је истинском игром који се опиру принципу најмањег дејства којим одређујемо до сада сваку познату трајекторију теоријске физике. А то исто је и подлога разликовања неживе физичке твари од живог бића. У суштини, моја ће теорија информације покривати домене и физике и вишка слобода, а оно што што их спаја биће игре — сматране изразом виталности, на пример.

Емисија информација је неспонтана по начелу минимализма и принудна због закона одржања. Поврх тога она је и нестална, па њену појаву прате измене. Ипак је информација ткиво свега простора, времена и материје, са неизвесношћу у својој суштини, тако да су њене физичке емисије увек везане за дејства (промену енергије током времена, односно импулса на путу). Отуда напор неизвесности и отпор сили вероватноће, због које се чешће догађају вероватнији исходи, да би лењост била у природи ствари, виталност „неприродна“ појава, а успеси виших нивоа игре (Reciprocity) напорнији.

Зато је неизвесност подлога игре, јер само са њеним вишковима можемо одступити од њеног минимума (Packages) и напустити терен саме мртве физичке супстанце, а онда је „вишак опција“ (информација) тло где неко или нешто може истински побеђивати опонента. Зато „игре“ које немају црту неизвесности не сматрам правим играма, због истог онога због чега без (вишка) неизвесности нема праве победе.

Сама физичка природа не може да лаже и не уме да се игра. Због првог она не може спознати себе (Нестварно), јер попут методе контрадикције (помоћу лажне претпоставке доћи до истинитог става) нема ни истинске математике без нетачних тврдњи као алатке, а због другог, мртве твари немају способност побеђивања, већ само трајања спонтано се мењајући. Такмичећи се са виталнима, мртва природа је страна која губи. Уопште, теже је бити виталнија страна надметања, али то је она која побеђује не само чешће, него кажемо и на вештији начин.

Unstable

Питање: Појасните ми то „информација је нестална“?

Unstable

Одговор: Питање је у контексту игара па имамо такав и одговор, за разлику од неких претходних (Disorder). Пре свега, познато је да поновљањем „вест“ није она вест, а зато што је информација ткиво космоса биће последица баш овакве несталности. Отуда сви почеци сличних одговора, па и овај.

Занимљиво постаје досадно начелно (минимализам) истим поступцима којим мозак више воли познато. Тежећи мањој информацији, смањеном дејству, или вероватнијим исходима, радије идемо уходаним стазама. Ми прижељкујемо ред, волимо налазити правила, све од бољих друштвених до природних закона, мање или више несвесни да то има исто полазиште као потреба за удруживањем (предајом личних слобода ради колективне сигурности или ефикасности), или, са друге стране, зато што свака нова вест „нестаје“ и поново „настаје“ претходној сличној или различитој ако је снажније размењена.

Unstable b

Технолошки замор материјала је успоренији ток исчезавања вести због њиховог осциловања између блиских стања комуникације. Ти циклуси постоје скоро свугде, од титрања молекула, звука. Цвркут одређене врсте птица који траје 8 секунди, у мировању и наше срце може куцати једном у секунди. А попут путева детерминистичког хаоса (в. линк слике), ова понављања се стално бар помало мењају.

Смењивања умирања и рађања одржавају биолошку врсту, што и самим циклусима даје смисао стања (и формално, стања и процеси су вектори), па трајање врста има своја ограничења. Пропаст једних на тржишту има често наставак у економском успеху других, штавише води у благостање и трајање друштва, да би онда и друштва (као врста стања) кружила кроз своје падове и успоне. Пропасти неких држава, или империја добробит су за просперитет каснијих, јер су и историјски токови циклуси у сталним и помало другачијим појавама.

Све ово је у складу са начелном јединственошћу, јер иначе теорија не би ваљала. Рисова лема алгебре утврђује да свака функционела на коначно димензионалном векторском простору има јединствен вектор којим њу дефинишемо, тако да у интерпретацији:

(вектор) → (стање),   (функционела) → (информација перцепције),

налазимо јединственост учесника опажања. Отуда нужност разлика, од унутрашњих рецимо друштава кроз историју, до разлика изван фотона који путује свемиром.

Све ово указује на проблем кориштења збира производа (Grizzly):

siu = si1u1 + si2u2 + ... + sipup

стратегија и учесника игара. Коефицијенти sik се мењају током саме игре, па и пребрзо да би сви били захваћени истом формулом: Рецимо као што новим моделима техничких уређаја, попут ТВ апарата и аутомобила, или сличних, опада привлачност и пре него што „освоје свет“. Произвођач им једва држи вредност током четири године, до застаревања и избацивања новог модела. Сличан проблем настаје и са овим дугим збировима, почев од самог вредновања информација које лако бледе, па до њихове крајње употребе.

Divergence

Питање: Можете ли бити конкретнији са „тешкоћама збира производа“?

Divergence

Одговор: Избегавам оптерећења ових одговора математиком, већ се чешће држим интерпретација и само понекад крајњих доказа. Ово је прилика за један такав (в. Информатичка Теорија I, страна 106) тежи, пример 3 из дела 40. Непрекидне перцепције.

Густина расподеле вероватноће:

\[ \varphi(x) = \begin{cases} \frac{1}{x\ln^2x}, & x \ge e \\ 0, & x \lt e, \end{cases} \]

је добро дефинисана, јер је (∀ -∞ < x < ∞) φ(x) ≥ 0 и:

\[ \int_{-\infty}^{+\infty} \varphi(x)\ dx = \int_{-\infty}^e \varphi(x)\ dx + \int_e^{+\infty} \varphi(x)\ dx = \] \[ = 0 + \int_e^{+\infty}\frac{dx}{x\ln^2x} = \int_e^{+\infty} \frac{d\ln x}{\ln^2x} = -\left.\frac{1}{\ln x}\right|_e^{+\infty} = 1. \]

Овај интеграл конвергира, међутим Шенонова информација ове густине дивергира:

\[ S(\varphi) = -\int_{-\infty}^{+\infty} \varphi(x) \ln \varphi(x)\ dx = -\int_e^{+\infty} \frac{1}{x\ln^2x}\ln\frac{1}{x\ln^2x}\ dx = \] \[ = \int_e^{+\infty} \frac{\ln(x\ln^2x)}{x\ln^2x}\ dx = \int_e^{+\infty} \frac{\ln x + 2\ln(\ln x)}{x\ln^2x}\ dx = \] \[ = \int_e^{+\infty} \frac{dx}{x\ln x} + 2\int_e^{+\infty} \frac{\ln(\ln x)}{x\ln^2x}\ dx \ge \] \[ \ge \int_e^{+\infty} \frac{dx}{x\ln x} = \left. \ln(\ln x) \right|_e^{+\infty} = +\infty. \]

Коначна густина вероватноћа има бесконачну Шенонову информацију!

Шенонова (1948) информација је средња вредност Хартлијевих (1928) које су логаритам броја (једнако вероватних) исхода. Подсећам даље да средња вредност, рецимо три дужине a = 3, b = 4 и c = 5 нечега једнако узиманих износи (аритметичка средина):

\[ A = \frac13a + \frac13b + \frac13c = \frac13(a + b + c) = \frac{12}{3} = 4, \]

али ако другу узимамо два пута чешће од прве, а трећу три пута чешће од прве, онда је просечна дужина коју узимамо:

\[ B = \frac16a + \frac26b + \frac36c = \frac16(3 + 2\cdot 4 + 3\cdot 5) = \frac{26}{6} = 6,5. \]

Логично је да је сада очекивана просечна дужина већа (B = 6,5 > A = 4) јер смо чешће узимали веће дужине. Уопште, иста логика важиће када узимамо више од три дужине, рецимо a1, a2, ..., an, по некој расподели вероватноћа, позитивних бројева збира p1 + p2 + ... + pn = 1. Тада је:

\[ \mu = p_1a_1 + p_2a_2 + ... + p_na_n. \]

У Шеноновом случају, ове „дужине“ су Хартлијеве ak = -log pk и требало би да је све у реду, али није. Као да нас сама математика овде упозорава да нешто нисмо добро разумели.

Навешћу још један пример проблема са средњом вредношћу, откривен два века пре Шенонове информације, од Бернулија (1738), швајцарског математичара који је живео и радио у Русији. Тако је по њему назван тај Санктпетербуршки парадокс који и данас мучи математичаре. Замислио је следећу касино игру и покушао израчунати почетну уплату на основу средње вредности исплата играчу, да коцкарница не буде у губитку.

Баца се новчић узастопно и са сваким падањем „глава“ вредност исплате се дуплира, све док први пут не падне „писмо“. Рецимо, почетна вредност исплате је $2, а новчић је фер. Вероватноћа да већ у првом покушају буде „глава“ је 1/2, да два пута узастопно падне „глава“ је 1/2², ... и уопште да „глава“ падне k = 1, 2, 3, ... пута узастопно је pk = 1/2k. Средња вредност исплате је:

\[ \mu = \frac12\cdot 2 + \frac{1}{2^2}\cdot 2^2 + ... + \frac{1}{2^k}\cdot 2^k + ... = 1 + 1 + ... + 1 + ... \to \infty. \]

Ово није логично, јер шанса да при бацању фер новчића стално и стално пада само „глава“ је никаква. Математичко очекивање (тако зовемо ове средње вредности) ове игре је да произвољан играч заради бесконачне количине новца. На задовољавајуће објашењење парадокса чекамо још увек.

Win-Win

Питање: Зашто стратегија „win-win“ увек губи, знате ли?

Win-Win

Одговор: Разговори овог питања долазе око резултата симулација неких игара, а поводом анализе алгоритама. Одговори су шетали углавном око „немам појма“. Вас ћу штедети тог дела теоретисања.

Ситуација „win-win“ била би око отприлике „добро мени а добро и вама“, као у трговини када дате новац за робу. Она је зато компромисна, трговачка, или почесто жељена политичка ситуација. Политика ће зато „покварити играчку“, када год се умеша у иоле мајсторску игру, јер она приоритетна ситуација, као стратегија „win-win“, губи скоро сваку игру другачијих играча. Више пута сам писао о томе (Win Lose), али као да увек остајемо без доброг теоријског објашњења.

1. За разлику од „стања“ као слике једног тренутка низа догађаја, такође имамо „стање“ процеса које формално личи на синусоиду са претходне слике десно. Природа је сва у таласима, па се смењују и успеси и порази, хтели ми то или не. Зато ће стратегија „lose-lose“, са жртвама до победа, скоро увек побеђивати „win-win“, где се надовезују сами успеси. Чекати да нам срећа падне у крило не чинећи ништа, не умарајући се, значиће пропуштање шанси и склањање пред успешнима.

У овом покушају теоријског објашњења неуспеха стратегија „win-win“ у компјутерским ситуацијама, приметимо да њени играчи себи ускраћују разноликост, тиме и моћ неизвесности. Они се спуштају на нижи ниво количине опција (информације перцепције) у комуникацији за победу, постајући ближи мртвој физичкој твари и чистом принципу најмањег дејства. У том смислу тумачење припада класификацији личности.

2. Дружећи се само са „добрим“ (апстрактно, бити врста окружења), не користећи „лоше“ чак ни против „лошег“ које би надирало, значи бити играч а не играти се, одустати од надметања, али поред тога и налазити се на све мањем острву „доброг“. Парафразирам тополошку скицу игре. Граф „добрица“ не би се сужавао само у случају да „лоши“ одустану од напредовања, или да их неко трећи спречи, али то онда значи слабост стратегије „win-win“. То је друго објашњење њиховог лошег успеха.

У овом другом покушају разумевања неуспеха стратегија „win-win“, свет је позорница борби „добра и зла“ у најширем смислу бодовања, када тај који се нађе на сцени нема избора, него борити се или нестати. Заиста, виталност је пре свега ствар биолошке еволуције врста где опстају само прилагођени околини која се стално мења. А околина је често „зла“ ка вама, било да сте друга врста бацила, друге биљке, или животиње. Онај ко би само чекао да спаја „добро и добро“, не траје.

3. Према првом, разноврсност је предност играча, односно система, па је једноличност мана. Било да ову другу структуру називамо „добрим“, или „злим“, што је у апстрактним разматрањима само ствар конвенције. Ово такође налазимо у пракси, рецимо просперитетнијих и конкурентнијих предузећа или држава које су толерантније на нове, чудне, или на први поглед одбојне појаве. Мешане средине, као и мешање гена у продужењу врста, имају своје такмичарске предности, свесне оне или не разлога свог квалитета.

Иако извире из првог, ово је заправо већ трећи покушај тумачења лошег пласмана стратегија „win-win“. Једноличност, више одбојна, неприродна због тежње ка мањој информацији (Екстреми), нестабилно је стање. Она није позиција у којој се буде да би трајало, него се изврће у нешто треће, често неочекивано и понекад непријатно. Отуда ће преовлађујуће стање „зла“, као и претежног „добра“, гледајући на њих апстрактно просторно, односно графички — бити неодрживо.

4. Узгајајући зло добијамо још зла, исто као уништавањем конструкције, добро (+) и зло (-) се множе у лоше (-). Тако им дејства памтимо, видели смо (Summation). При томе, одговарајући добрим добро вратиће нам се добро (+ ‧ + = +), а на зло треба узвратити злим (- ‧ - = +), иначе губимо. То је логика „информације перцепције“, односно „збира производа“ ако скаларно множимо векторе чије компоненте су моћи две комуникације. Тај производ тада расте са виталношћу која је претпоставка боље игре.

У тој игри, мртва природа је дно дна, а њено попуштање слабијег пред јачим, или напредовање јачег против слабијег, без пркошења јак-јак и толеранције слаб-слаб, одлике су „win-win“ стратегије. Природа трпи и траје, дозвољавајући постојање грабежљиваца, месождера или насиља уопште, као мањину (предатора је мање од плена им), почесто су ловци мање тежине, па и брзине или физичке снаге. Лос (800 kg) је плен вука (40 kg), или зебра (400 kg) плен лавице (140 kg). Као ловине масивније него њихови ловци оне губе због мањка жестине у виталности.

Monopoly

Питање: Како ова теорија објашњава монополе?

Monopoly

Одговор: У микроекономији је монополска фирма која нема одрживу конкуренцију. Она је једини произвођач производа индустрије и са огромнном је тржишном моћи, на пример у постављању цена знатно над граничним трошењем фирме. Детаље о тој, класичној врсти монопола видите под линком слике лево, а ми идемо даље према теми питања.

1. Није више тајна важна теза ове теорије да природа спонтано тежи мањој информацији да равноправност замењује поретком и ефикасношћу. Тако објашњавам „распадање“ мреже равноправних повезница на неравноправне чворове где су изузетни који имају много повезница наспрам многих са мало њих. Тако настаје појава „Шест степени раздвајања“, ради веће ефикасности повезивања.

На тај начин слободно тржиште капитала, са идејом равноправности по својству промета новца, роба и услуга, израста у место ретких који имају много ових капиталних повезница наспрам многобројних који их имају релативно мало. Та „чудна“ појава еволуције једнаких права у неједнака имања затим прераста у подређеност бирача (Win-Win играча, добрица) политичарима (манипулаторима), а ових имаоцима (злоћама).

Дубока држава развила је важну паролу „лажи локално и ради глобално“ којом са својим политичарима успешно влада њиховим народима. Ово је објашњење текуће политике на неуобичајен начин, али усклађујем га са категоризацијом карактера личности (Traits), а та оба са информацијом перцепције. То је позадина тог „неразумљивог“ причања о разумљивим стварима.

2. Међутим, крајњи глобализам (монопол власти) спречиће исте те силе које не дозвољавају равноправност. Када би само један од чворова имао све повезнице, а сви остали само по једну, био би то врх ефикасности по најмањем броју корака између два произвољна чвора. Али и једнакошћу осталих која није дозвољена. Надвладаће ово друго и развој ефикасности мреже ће се заустављати негде у разноликости чворова. Ово место попут је „Нешове равнотеже“ класичне економске теорије монопола.

Покушаји изградње све већег глобализма, као и све већих монопола било чега, разбијаће се као валови о стење пред корак до успеха, без обзира на улагање средства или напора глобалиста (монополиста), или откривање и елеминацију локалних криваца. Без разумевања механизма теорије на којој сада радимо, спонтаног тока природе ка мањој информацији, остаће сва данас позната тумачења као „гуске у магли“.

3. Да избегнем тривијалне примере, упоредићу ово са генезом космоса из Великог праска, који се још увек развија у очекивано ништавило око нас, због убрзаног удаљавања галаксија које би на крају требале све отићи иза границе нама видљивог свемира. Начело штедње информације сматрам довољно општим да обухвати и васионске размере, па отуда изводимо и аналогне закључке. Свемир се спонтано шири напуштајући једноличнну врућу почетну кашасту масу и, на за сада нама непознате начине, избећи ће одлазак у тамну једноличну празнину около.

Занимљив пример овој (хипо)тези је и сам вакуум (празнина простора), који као такав није одржива појава. Физика већ увелико ради са таквом „празнином“ из које на случајне начине искачу разне „честице-таласи“, али чији производи енергија и трајања остају испод кванта дејства, или испод Хајзенбергове неодређености. Такав вакуум добијаће на тежини (информације) док се информација супстанце около буде разређивала, али он то свакако добија, на основу исте ове теорије, јер физичка твар постаје простор.

На основу ове теорије информације, њене (хипо)тезе о успоравању нашег времена трајањем космоса, зато што процеси иду ка вероватнијим, мање информативним, односно ка мањем броју догађања, могу се изводити и неочекивани (другим теоријама физике) закљуци о вакууму. Оно што је премало трајања данас, код латентних честица које „искачу“ из вакуума, може бити довољно стварно сутра.

Amalgamation

Питање: Дубока држава методом „лажи локално и ради глобално“ над тројанцима својим политичарима неизлечива је болест демократије?

Amalgamation

Одговор: Није то једина слабост демократије (Monopoly, 1). Више је истицана (Democracy) наивна њена тежња ка равноправности токова капитала, која анализом графова, показује неминовност све мањег броја њих релативно све богатијих у односу на многе.

Прва, из постављеног ми питања, пре је део теорије игара као гране концепта „Информације Перцепције“ који овим прилозима покушавам појаснити. Политичар је природом свог посла у обраћању „добрицама“, као највећој популацији и главном извору својих гласача, принуђен да буде „манипулатор“, да брани неистине и изврће стварност. Самим тиме је лош реализатор против „злоћа“, изузетно ретких вештака у турнирима моћи. Политичари прихватају своју понизност пред снагом игре горњих (I лига) као свој допринос том тиму, даром лагања у владању доњима (III лигом) и сви сретни. То је једна „win-win“ ситуација, сматрају, надају се.

Смисао државе, њене демократије отуђује се, али кога брига — до слома таквих симбиоза. Природа не воли једнакост ни такав глобализам, свих испод малобројних, па ће он градитеље коштати све више и више, са све лакшим отпором рецимо националиста, сепаратиста и уопште посебних заједница. У надметању против природе, творцима глобализама стаће на пут разне њене „смицалице“. Неке од њих су многима слабо познате, као Симпсонов парадокс, а неке су можда уопште данас непознате.

Симпсонов парадокс је појава у вероватноћи и статистици у којој се тренд појављује у неколико група података, али нестаје или се обрће у супротан када се групе комбинују. На пример, нека су два политичара, зовимо их I и II, у предизборним анкетама у два округа A и B имали проценте гласова према табели:

A B
I 30% 35%
II 60% 26%

Укупно (A + B) први политичар има „само“ 65 одсто гласова, док други има 86 одсто и испада први лошији од другога. Међутим, први је у тим анкетама имао више гласова! Ево како.

За првога је у округу A анкета била са 30 „за“ од 100 анкетираних (30/100 = 0,30) и у округу B имала је 70 „за“ од 200 испитиваних (70/200 = 0,35). Укупно то је 100 „за“ од 300 испитиваних (100/300 ≈ 0,333). На супротној страни, код другог је у округу A анкета имала 60 „за“ од 100 испитиваних (60/100 = 0,60), а у округу B била је са 140 „за“ од 550 питаних (140/550 ≈ 0,255). Други има укупно 200 присталица од 650 испитиваних (200/650 ≈ 0,308), то другом политичару даје укупно мањи проценат подршке него првом политичару.

Љубитељи спорта понекад примете ове парадоксалне ситуације пратећи статистике играча или тимова кроз утакмице, али ако их питате за узрок „објасниће“ то углавном грешкама компјутера и оператера. То је почесто тачно, па оваква теоретисања пролазе незапажена. Зато сам се снебивао да их овде наведем (да не оптеретим тумачења информације перцепције) упркос једног важног момента, штете која тако настаје демократијама.

Овај „парадокс спајања“ можемо разумети представљајући број анкетних одговора и питања као векторе, рецимо на следећем, сличном примеру:

A B
I 10/40 → 25% 90/300 → 30% 100/340 → 29,4%
II 52/200 → 26% 64/200 → 32% 116/400 → 29,0%

Видимо да је збир парцијално процената у регијама (A + B) за првог и другог политичара редом 55% < 58%, док за укупни збир гласова важи 29,4% > 29,0%. Дефинишемо векторе првог a1 = (40, 10) и b1 = (300, 90). Код другога биће a2 = (200, 52) и b2 = (200, 64). Количници су 10/40 = 0,25 и 90/300 = 0,13 првога, а 52/200 = 0,26 са 64/200 = 0,32 другога. Они овакви представљају нагибе вектора према апсциси и заправо су тангенси углова које гради доња оса са векторима. Када ове векторе саберемо:

a1 + b1 = (340, 100)   →   100/340 ≈ 0,294   (29,4%)

a2 + b2 = (400, 116)   →   116/400 = 0,290   (29,0%)

добијамо да је нагиб другог збирног вектора мањи, иако су оба сабирка стрмија од првих. Чешће се стрмији вектори сабирају у стрмије, тако да нам овакви резултати изгледају парадоксално.

Дефинишемо ли апсцису као временску осу, а ординату као пут, онда су нагиби вектора средње брзине, количник пређеног пута током времена. Брзине се сабирају, али не и овако када се прво израчунавају као средње вредности по парчићима путева. Тиме се поново враћамо на Симпсонов парадокс статистике са идејом како насамарити демократију. Скупљање подршке увек је парцијално, из базе ка горе груписањем резултата. Овај се процес делегирања може злоупотребити начином „парадокса спајања“ у добитак тамо где га нема.

То штимање резултата анкета и избора морају радити аналитичари, по налогу „злоћа“ и можда понеким увидом „манипулатора“. Та одсутност „добрица“, првенствено због њиховог неразумевања методологије, биће згодна предност методе са становишта превараната демократије. Тако је могуће „коректним“ изборима добити посланике који у већини искрено представљају мањину бирача, народа који је учествовао у изборима, без додатног подмићивања или уцењивања изабраних.

На крају, признајем, све ово о демократијама споредна је прича да бих вам „подвалио“ једну тешку тему под питкијом. Једно од основних али тешких питања теорије физике информације како је формално могуће мање вероватним стањима (начелно нежељеним) укрупњавањем бити вероватнијима. Надам се да, са горњим објашњењима, препознајете тај механизам у „парадоксу спајања“.

Merging

Питање: Можете ли сада појаснити поменута израчунавања „из мањих у више вероватна стања“ стапањем?

Merging

Одговор: Ок, на слици лево су хиперболе једначина:

\[ y_1 = \frac{30}{x} + \frac{70}{300 - x}, \] \[ y_2 = \frac{60}{x} + \frac{140}{650-x}, \]

што одговара подацима из прве табеле (Amalgamation) одговора, Симсоновог парадокса, сменама променљиве x = 100. Добијено је:

y1(x) < y2(x),   тј. 65 < 86   ⇒   100/300 > 200/650,   tj. 0,333 > 0,308.

На овој слици имамо, пак, апсцисе x1 < x2 и ординате y1 > y2 са поново истим здруженим резултатом 100/300 > 200/650. Бирајући другачије вредности апсциса x1 и x2, мењамо вредности ордината, али здружени резултат увек је исти, са параметрима датих хипербола. Дакле, видимо како је могуће манипулисати парцијалне вероватноће. Код претходног одговора то су 30% и 35%, односно 60% и 26%, анкета из области A и B. Однос стопљених вероватноћа, коефицијената 0,333 > 0,308 исти је.

До захтеваног објашњења питањем стижемо гледајући на y1(x1) и y2(x2) као мање вероватноће неких мањих појава, подскупова начелом штедње информације (Минимализам) стопљене у веће појаве већих вероватноћа. Мање вероватна више су неизвесна и информативнија стања која би да спонтано прелазе у више вероватна и стога мање информативна стања.

Видели смо (Range) да дедуктивне теорије које би карактерисале једну једину структуру нису могуће, што значи да прерастања „мање у више вероватна стања“ по овом моделу стапања имају разних примена. То је квалитет добре теорије да је „свачија“ за разлику од праксе која је увек „нечија“ (Abstractions), како сам парафразирао (Ловенхеим-Сколемову теорему) подвлачећи непоновљивост „информације прецепције“, или јединственост (особеност) сваког субјекта космоса у односу на околину. Према томе, сада смо још увек на почетку нове теорије информације.

Empire

Питање: Како да у обичном и кратком разговору дефинишем „игру“?

Empire

Одговор: Надметање и слободу постављајте као важне састојке игре, па како год. Доминирања циљеви су игре, а њени кораци иду путем слобода.

У простијем случају, попут игре „крстић-кружић“ у којој се циља попуњавање једне линије табле својим знацима (x или o) а тако што вучемо потезе који ће нама давати више или другоме мање опција, преко шаховских игара (Siege, Courtyard, ...) које такође воде слична начела (овладати „нечим“ а кроз вишак „опција“), па уопште до увећања „Информације Перцепције“.

Подлога таквих одредница игре је акција-реакција (Reciprocity) када год је могуће креативним (непредвидљивим опоненту) потезима, са добрим тајмингом и одмереном снагом (заправо „количином неизвесности“ или „силом вероватноће“). Таква је, додуше, део моје „теорије информације“, новина за теорију игара и за сада неистражена прича коју само назиремо у следећим примерима, али њена основна идеја показала се успешном у симулацијама.

1. На пример, француски филозоф Жан Жак Русо описивао је ситуацију трговине, сигурности и поверења за постизање веће добити помоћу два ловца. Они лове јелена који је већи и укуснији за јеловник (A) и зеца (B) такође укусним али слабијом попуном. Уловити A је захтевније и тражи сарадњу; усамљеном ловцу су шансе за улов A мање. Напротив, уловити B је више самотњачки посао. Први улов је већа добробит за друштво, он тражи „поверење“ међу ловцима када сваки верује да ће други удружити снаге са њим, па му у игри „јелен-зец“ припада прво поље табеле:

I \ II A B
A 5; 5 0; 3
B 3; 0 3; 3

Ова игра има две равнотеже чисте стратегије, позиција (A; A) и (B; B). Позиција је Парето доминантна над другом када би бар једној страни (учеснику игре) било стриктно боље на првој него на другој позицији, али никоме не би било горе. Позиција (A; A) Парето доминира (B; B), међутим су обе „социјално“ боље од остале две. Нешова равнотежа је само прво поље (A; A) и она је зато посебна, јер претпоставка да други неће удружити снаге води лошијем улову.

Том класичном опису сада додајмо вредност „информације перцепције“. То је скаларни производ (вектора, низа) одговарајућих компоненти два стања који се могу (али не морају) опажати, односно перципирати, или комуницирати. Размене информација су интензитети компоненти које веће значе већу жестину спреге, виши ниво игре, односно већи улов, тј. исплату. Јасно је да овако објашњена ова вредност као збирна исплата играча постаје максимална у пољу (A; A) горње табеле.

2. Замислимо сада два ловца која се међусобно не толеришу у ситуацији сличној претходној, када би они у заједничком лову пре били опасност један другоме него што би нешто уловили. Табела игре је:

I \ II A B
A -5; -5 0; 3
B 3; 0 -3; -3

Слична би табела била за два непријатељска племена која доносе одлуке о просперитетним пројектима A и B, ако би злурадо настојали да оштете другу страну. Тада би за заједничко „добро“ они бирали „зло“. Међутим, када су у пољима табеле жестине игре, онда ови минуси постају плусеви, а при томе се мењају циљ и смисао игре; опет доминација путем опција.

Виталнија је игра она у већем супротстављању опонената које значи веће удаљавање од принципа најмањег дејства физике. Тада се на „добро“ иде са „добро“, а на „зло“ се узвраћа са „зло“. Још је боље да се то исто уради сразмерно сопственим моћима, правовремено и непредвидљиво. Свако то удаљавање мера је виталности помоћу „информације перцепције“.

3. Игра се може разумети и као надметање са самим собом. Призори са животиња у игри су широко познати, било да се ради о штенадима који се боре, мачићима који нападају или делфинима у брчкању на таласима. Игра није ограничена само на младе животиње; одрасле јединке многих врста такође је практикују (Play Behavior). Игра је и код животиња израз вишка слобода (живих бића) у односу на неживу физичку твар од које се састоје.

Вишак неизвесности је аналоган потенцијалној енергији коју захватамо подижући крамп да би га дубље забили у тло, када се тај сав претворио у кинетичку енергију — у сврху и ефикасност. Тако ће се анализа текстова писаца показивати са већим смислом или са стилом ако је информација појављивања слова или речи мања (Letter Frequency). Слично, игра иде ка доминацији путем слободе.

Criterion

Питање: Имате ли неки крајњи критериј за „игру“?

Criterion

Одговор: Ако сам разумео ваше питање, обзиром на претходни одговор, оно се може свести на разликовање живог и неживог бића. Да бисмо могли „играти“ треба нам виталност, а то је тај вишак информације (количине опција) коју физичка твар нема.

Другим речима, ако сте сасвим физички реалан систем (биће), онда доследно следите начело најмањег дејства и за вас важи закон одржања (Conservation II). Одлика је ове теорије информације да „реалност“ сматра доменом информације за коју важи закон одржања, док под „нестварним“ смешта многе друге појаве (фикције, идеје, законе) које би могле бити само „алатке“ физике. Тај вишак слободе (виталност) придружен физичкој супстанци има моћ лагања, одступања од принципа најмањег дејства, те играња. То је моја лична ствар, једна полу-анонимна прича која има своју историју.

У почетку, када сам информацију још увек гледао као Шенонову (1948), као средњу вредност Хартлијевих (1928), било ми је занимљиво откриће да се се она под изводом понаша као константа (Conservation law, 2014), ако вероватноћу третирамо на начин обзервабле. Поред осталог, негде у то време, забављао сам се неким математичким облицима информација сличних Шеноновој и, неколико година касније, нешто од тога ставио у скрипту „Физичка информација“ (2019). Тамо је циљано да збир делова информације увек буде једнак њеној целини.

Недуго затим започео сам писати овај блог (Conservation) за ужи круг пријатеља. Неки од њих били су рецензенти мојих књига, или су ми на разне начине помагали у организацији ових података. Одговарао сам на питањa као: „Како знамо да је нешто реално?“ (Conservation II), наравно, сводећи одговор на закон одржања информације. Тада већ увелико, био сам у тестирању (хипо)тезе да је информација основа простора, времена и материје, а да је неизвесност њена суштина. Заправо, више нисам имао поверења у концепт детерминизма (до тада „светог грала“ физике), нити материје као најважније подлоге васионе.

Од занимљивих питања на ту тему било је и о постојању пресликавања која могу сачувати скаларни производ (Conservation III). Информација перцепције је врста скаларног производа. Питање као: „шта омогућава меморисање информације?“ (Conservation IV), такође сам свео на закон одржања. Доследан наставак је посматрати и игру таквом. Према томе, нешто за што вреди закон одржања — не игра се. Односно, оно што се може играти мора моћи лагати и бити недоследно.

Hyperbole

Питање: Како се мења информација перцепције игре?

Hyperbole

Одговор: Вектори \(\overrightarrow{OA} \) и \( \overrightarrow{OB} \), на слици хиперболе, x² - y² = 1, су стања играча. Угао ∠(AOB) = φ, интензитети два вектора a и b, истим редом, представници су величина које дефинишу збир производа Q = a1b1 + ... + anbn, скалрани производ два вектора:

a = (a1, ..., an),   b = (b1, ..., bn)

у неком n-дим систему координата. Мало опширније о хиперболама као и уопште о кривама другог реда (конусним пресецима) наћи ћете у мом прилогу „Аналитичка геометрија II“.

Међутим, чак и за велики број димензија n ∈ ℕ, два вектора заједничког исходишта (O) су у истој равни, као на тој слици горе десно. Компоненте, множитељи ak и bk, редом индекса k = 1, ..., n, представљају интензитете одговарајућих акција и реакција опонената. Из алгебре вектора знамо да је тај интензитет такође Q = a b cos φ, тако да информација перцепције Q њихове комуникације расте са дужинама a и b, а опада са већим углом φ.

1. То је кратак преглед познатих, утврђених ствари на „клизавом“ терену који тек треба описивати. На слици су вектори једнаких дужина, као што је обично на такмичењима учесника једнаких категорија. Због симетрија хиперболе и тачка A(x, -y) се централно симетрично пресликава на тачку B(x, y) около (то је и ротација за 180°) центра C(x, 0), што значи да је AB окомито на OC, те да је AC = CB. Такође је ab = x² - y² = 1, јер су то тачке хиперболе. Ово значи да је скаларни производ тако симетричних парова дате хиперболе константан!

Са друге стране, на фер такмичењу (такмичара исте категорије) игра се увек може представити горњом скицом. Повећавање интензитета двају вектора одговара већим напорима учесника, учешћу више опција, или јачих дејства, што говори о пата позицији коју сам такође објашњавао, другачије осветљено (Standoff). Мењају се интензитети играча a = b са углом φ, али не и снага игре.

2. Те нам формуле говоре и о одбојној сили неизвесности, еквиваленту силе вероватноће. Препуштени тој сили, стања опонената кретала би се по хиперболи, која је поред параболе и елипсе врста конусног пресека. Из ранијих израчунавања знамо да су такве трајекторије набоја одлике константних централних сила (попут електричне, или гравитационе), а такође да за њих важи Кеплеров други закон (потег од сунца до планете током једнаких времена пребрише једнаке површине).

Небеска се тела крећу коникама по инерцији тесно се држећи принципа најмањег дејства, као и опоненти у кличну који се не умарају сувишном комуникацијом (променом интеракција). Тек промена виталности игре покреће промену њеног тока, као што и додатно дејство мења устаљено кретање тела.

3. Ово указује на напор пркоса игре, супротстављања принципу најмањег дејства физике. За то је потребна, дакле не и довољна, виталност играча. Остајући са симетричним напорима стања ће такмичара остајати на истој хиперболи, са векторима непромењеног скаларног производа па и сталне информације перцепције. Да би се изменила и информација перцепције мора се мењати Q = a b cos φ. То се може десити другачијом хиперболом, рецимо са играчима другачије лиге, односно категорије.

4. Информацију перцепције мењаће и једнострана промена параметара једног од игача, узмимо да је то B, када би он играњем силазио у слабију лигу и почео да губи, тако да се мења само b⋅cos φ. Приметимо да се ово може постићи и ојачавањем b, али узалуд се напрежући због удаљавања од игре и повећавања угла φ са знатним смањењем косинуса. Порастом угла смањује се косинус.

За отежавање враћања „губитника“, за избегавање непријатнијих већих личних напора, помаже нам да опонента застрашујемо, обесхрабрујемо, преувеличавамо њему вредности толеранције, или се полако „нагињемо напред“ саветујући компромисе и миц-по-миц пузајући освајајући адуте друге стране (Sneaking). Ову последњу методу познајемо као стратегију политике запада данас.

5. Могуће је да слабији губи а да је информација перцепције игре (неко време) остала иста. Та уопште, игра у којој је информација перцепције константна, делује као да није игра, у смислу претходног критеријума. Њени су учесници попут неживе твари, склони „не таласању“, јачи да лошији не живне, а слабији да не наљути (оживи) бољег. Напетост која остаје непромењена симулира процесе без неизвесности, беживотне и инертне, налик мртвом телу. Има такву форму.

Penalties

Питање: Слажете ли се да „строгост кажњавања има мали или никакав утицај“ на рецимо незакониту трговину дрогама?

Penalties

Одговор: Разговарамо поводом мог текста „1.10 Злочин и казна“ (стр. 23) извод скрипте „Приче о информацији“ (2021) претходно прилога новинама. Сам наведен део питања препознајемо цитат је аутора истраживања трговине дрогама пре те приче (MacCoun and Reuter, 1998: 213).

Већина тих анализа одвраћања претпоставља теоријски контекст одлуке: криминалци меркају трошкове и користи за дато криминално понашање са одређеним нивоом казне и вероватноћом откривања. Међутим, у овој врсти анализе занемарује се рационалност контролних агенаса. Казна је претећа само ако се криминалци заиста открију. При томе, за откривање је потребан напор и желећи рационалну контролу настојимо побољшати свој ниво у складу са нивоом криминала и обрнуто. Теорија игара пружа предвиђања о интеракцији између стопе криминала и контроле. Навод је део из увода једног експерименталног (статистичког) истраживања, како се назива, о „инспекцијској игри“ (Heiko Rauhut: Higher Punishment, Less Control? 2009).

Играчи желе да избегну предвидљивост у таквој ситуацији. У терминима теорије игара, нема решења у „чистим стратегијама“. Ако прелиминарно предвиђамо пазимо да би криминалци и контролни агенти могли стално мењати своје понашање како би били непредвидиви. Ово су нам познате препоруке класичне теорије игара које имају ново зачење у овој теорији информације, пре свега због важности „непредвидивости“.

На страну праксу, озлеђеност оштећеног и саосећање маса, потенцијални унутрашњи гнев који вреба да експлодира у претерану жеђ за кажњавање било кога, за осветом неправдама које су нам икада чињене, нагон смрти, и слично, погледајмо шта каже данас позната теорија, речима професора емеритуса Дејвида Брауна: Строгост казне, у смислу појаве „маргиналног одвраћања“, нема стварни ефекат одвраћања, нити смањења рецидива.

Али, авај, знамо да оваква теоретисања не препознају управо домицилне земље аутора. Напротив, управо се у таквима чешће прописују строжије казне у односу на остатак света и, при томе, оне имају бројније, скупље, или страшније злочине.

Дакле, слажем се да у процесима кажњавања због нарушавања правила друштвеног понашања строгост према прекршитељу није мерило успеха. Хладне главе у рационалним расправама многи ми стижемо до сличних закључака, па је интересантније питање зашто пракса законодавства не прати наводне стварне потребе друштва. То је посебна тема моје теорије информације, још неистражена, а коју евентуално могу најавити.

Неистина није доследна (Criterion) и, према томе, законодавство циљано не према стварним потребама друштва, благодетно је за „манипулаторе“ (Traits) који су посредници „злоћа“ у владању „добрицама“. У масовнијој доњој лиги, поред реченог, многи се од нижих житеља добро проналазе у лошим законима па промену на „боље“ и не желе, или не разумеју. Веома су се навукли на искривљену слику својих „потреба“ да би их бранили, на пример, као некада роб свога господара.

Hyperbole II

Питање: Можете ли ми објаснити „пенале“ на примеру „хиперболе“?

Hyperbole II

Одговор: Да. У идеалном случају, лоше „понашање“ за заједницу је A(x, -y), а предвиђена „законска“ мера B(x, y), на слици хиперболе десно. Скаларни производ та два стања, тако интерпретирана, је:

\[ \overrightarrow{OA}\cdot\overrightarrow{OB} = x^2 - y^2 = 1. \]

То је дужина OT од исходишта до темена ове хиперболе.

Дужина OT = 1 се неће мењати клизањем тачке AA' доле по хиперболи, па неће ни наведени скаларни производ ако тачку A симетрично прати тачка BB'. Ова два стања се множе у информацију перцепције „злочин-казна“ оптималне и идеалне, можда недостижне „државе права“.

Подсетимо се да у другом координатном систему ови вектори могу имати по n ∈ ℕ одговарајућих координата. Иначе их пишемо на неки од начина:

\[ \begin{cases} \overrightarrow{OA} = \vec{a} = \textbf{a} = (a_1, a_2, ..., a_n), \\ \overrightarrow{OB} = \vec{b} = \textbf{b} = (b_1, b_2, ..., b_n). \end{cases} \]

Такав један запис скаларног производа је:

\[ \textbf{a}\cdot\textbf{b} = a_1 b_1 + a_2 b_2 + ... + a_n b_n = ab\cos\varphi \]

где су интензитети вектора a = ∥a∥, b = ∥b∥ и φ = ∠(AOB) је угао између. У комбинацији са претходним, ово нам говори да растући број компоненти стално идеалне државе права, n → ∞, неће променити њену информацију перцепције. Она је константне вредности OT = 1, што значи и оптималну стратегију (Reciprocity), непобедиву у надметању, али у клинчу, статичну и која је таква прешла у сарадњу опонената.

Као два боксера који се одмарају у клинчу, или државе исцрпљене дугим ратом без победника, ова статична спрега информација симулира мртву твар, односно принцип најмањег дејства физике. Ово је понашање попут електрона заробљених привлачном силом протона у љускама атома када би им за изласке требале додатне енергије, које они немају. Као вртлог. У описивању класичне теорије игара, ово би била врста равнотеже из којег свака од страна може ићи само у неповољније, нежељено стање.

Са нашег данашњег становишта гледано, појединац правне државе тако непобедиве снаге био би веома неслободан. Веома уређена држава личи на самостално живо биће, јединку са специјализованим, покорничким и ограничено репродуктивним животом. Одричући се приватних слобода зарад колектива, за више сигурности или ефикасности тежимо ка таквој заједници.

У екстремном општем случају бесконачно великих стања (a, b → ∞), које је боље називати свевременске, или свеприсутне поједине информације, какве су теореме, исте хиперболне тачке пример су привржености неких појава. Не комуницира све са свачим и, тада, неће се сваки вектор b моћи овако спрезати са датим вектором a. Међутим, они који јесу такав пар, ће бити чврсте везе као закони.

Због бесконачности компоненти, око сваког датог a налазе се безбројни партнери попут b. Због њих можемо рећи да је добра теорија „свачија“ а пракса је увек „нечија“ (Abstractions), без Ловенхеим-Сколемове теореме овај пут.

Previous

Август 2024 (English ≽)

Next

Тема:

Ово је наставак одговора МиниМакс, на тему теорије игара. Држаћу се углавном једноставнијих разматрања и описивања корисних за информацију перцепције.