mentální Model: zkreslení z necitlivosti na velikost vzorku

rozšířené nedorozumění náhodnosti způsobuje mnoho problémů.

dnes budeme zkoumat koncept, který způsobuje mnoho lidských chyb. Říká se tomu zkreslení od necitlivosti k velikosti vzorku, nebo, chcete-li, zákon malých čísel.

necitlivost na malé velikosti vzorku způsobuje mnoho problémů.

* * *

Pokud budu měřit jeden člověk, který se měří 6 stop, a pak řekl, že všichni na celém světě bylo 6 metrů, byste intuitivně jasné, že je to chyba. Řekli byste, že nemůžete měřit pouze jednu osobu a pak vyvodit takový závěr. K tomu budete potřebovat mnohem větší vzorek.

a samozřejmě byste měli pravdu.

i když je tento příklad jednoduchý, je klíčovým stavebním kamenem našeho chápání toho, jak nás necitlivost na velikost vzorku může vést na scestí.

jak píše Stuard Suterhland v iracionalitě:

Před vyvozování závěrů z informací o omezeném počtu událostí (vzorek), který je vybrán z mnohem většího počtu událostí (populace) je důležité pochopit něco o statistiky vzorků.

V Myšlení, Rychlé a Pomalé Daniel Kahneman píše „náhodné události, podle definice, není vhodný pro vysvětlení, ale sbírkách náhodné jevy mají chovat ve vysoce regular móda.“Kahnemen pokračuje,“ extrémní výsledky (vysoké i nízké) se častěji vyskytují v malých než ve velkých vzorcích. Toto vysvětlení není kauzální.“

My všichni intuitivně víme, že „výsledky větší vzorky si zaslouží víc důvěry než menší vzorky, a dokonce i lidé, kteří jsou nevinní statistických znalostí slyšeli o tomto zákonu velkých čísel.“

princip regrese k průměru říká, že jak velikost vzorku roste, větší výsledky by se měly sbližovat se stabilní frekvencí. Takže, pokud jsme obracející mince, a měření podílu krát, že jsme si hlavy, měli bychom očekávat, že přístup 50% poté, co některé velké velikosti vzorku, řekněme, 100, ale ne nutně, 2 nebo 4.

v našich myslích často nedokážeme zohlednit přesnost a nejistotu s danou velikostí vzorku.

Zatímco jsme všichni pochopit intuitivně, je pro nás těžké si uvědomit, že v okamžiku zpracování a rozhodování, že větší vzorky jsou lepší prohlášení než menší vzorky.

pochopit rozdíl mezi velikostí vzorku 6 a 6.000.000 poměrně dobře, ale my nevíme, intuitivně pochopit rozdíl mezi 200 a 3000.

* * *

tato zaujatost má mnoho podob.

v telefonickém průzkumu 300 seniorů podporuje prezidenta 60%.

pokud byste měli shrnout poselství této věty přesně třemi slovy, co by to bylo? Téměř jistě byste si vybrali “ staršího prezidenta podpory.“Tato slova poskytují podstatu příběhu. Vynechané podrobnosti průzkumu, že to bylo provedeno na telefonu se vzorkem 300, nejsou samy o sobě zajímavé; poskytují základní informace, které přitahují malou pozornost.“Samozřejmě, kdyby byl vzorek extrémní, řekněme 6 lidí, zpochybnili byste to. Pokud však nejste plně matematicky vybaveni, intuitivně posoudíte velikost vzorku a nemusíte reagovat jinak na vzorek, řekněme, 150 a 3000. Že, ve zkratce, je přesně význam tvrzení, že “ lidé nejsou dostatečně citliví na velikost vzorku.“

část problému spočívá v tom, že se zaměřujeme na příběh nad spolehlivostí, nebo, robustnost, výsledků.

systémové myšlení, to je naše intuice, není “ náchylné k pochybnostem. Potlačuje nejednoznačnost a spontánně konstruuje příběhy, které jsou co nejvíce soudržné. Pokud není zpráva okamžitě negována, asociace, které vyvolává, se rozšíří, jako by zpráva byla pravdivá.“

vzhledem k velikosti vzorku, pokud to není extrémní, není součástí naší intuice.

Kahneman píše:

přehnané víře v malých vzorcích je pouze jeden příklad z více obecné iluze – budeme věnovat větší pozornost obsahu zprávy, než aby informace o jejich spolehlivost, a jako výsledek, skončí s výhledem na svět kolem nás, který je jednodušší a soudržnější než data ospravedlnit. Ukvapené závěry je bezpečnější sport ve světě naší představivosti, než je tomu ve skutečnosti.

* * *

například ve strojírenství se s tím můžeme setkat při hodnocení precedentu.

Steven Vick, psaní ve Stupních Víry: Subjektivní Pravděpodobnost a technického Úsudku, píše:

Pokud něco fungovalo dříve, předpoklad je, že to bude fungovat znovu, aniž by se nezdaří. To znamená, že pravděpodobnost budoucího úspěchu podmíněná minulým úspěchem je považována za 1,0. Tedy strukturu, která přežila zemětřesení by se předpokládat, schopný přežívat i se stejnou velikostí a vzdáleností, s základní předpoklad je, že normativní, kauzální faktory musí být stejné. Ale seismické pohyby země jsou poměrně variabilní ve svém frekvenčním obsahu, útlumové charakteristiky, a mnoho dalších faktorů, takže precedens pro jediné zemětřesení představuje velmi malou velikost vzorku.

Bayesovské myšlení nám říká, že jediný úspěch, bez dalších informací, zvyšuje pravděpodobnost přežití v budoucnu.

svým způsobem to souvisí s robustností. Čím více jste museli zvládnout a stále přežijete, tím robustnější jste.

podívejme se na některé další příklady.

* * *

Nemocnice

Daniel Kahneman a Amos Tversky prokázala naše necitlivost k velikosti vzorku s následující otázkou:

určité město se podává ve dvou nemocnicích. Ve větší nemocnici se každý den narodí asi 45 dětí a v menší nemocnici se každý den narodí asi 15 dětí. Jak víte, asi 50% všech dětí jsou chlapci. Přesné procento se však mění ze dne na den. Někdy může být vyšší než 50%, někdy nižší. Po dobu 1 roku každá nemocnice zaznamenala dny, kdy více než 60% narozených dětí byli chlapci. Která nemocnice podle Vás takových dnů zaznamenala více?

  1. větší nemocnice
  2. menší nemocnice
  3. O stejné (to znamená, že do 5% z každé další)

Většina lidí nesprávně vybrat 3. Správná odpověď je však 2.

v úsudku v manažerském rozhodování vysvětluje Max Bazerman:

většina jedinců si vybere 3, očekává, že obě nemocnice zaznamenají podobný počet dní, kdy 60 procent nebo více dětí jsou chlapci. Zdá se, že lidé mají nějakou základní představu o tom, jak neobvyklé je mít 60 procent náhodné události vyskytující se v určitém směru. Statistiky nám však říkají, že je mnohem pravděpodobnější, že pozorujeme 60 procent mužských dětí v menším vzorku než ve větším vzorku.“Tento efekt je snadno pochopitelný. Přemýšlejte o tom, co je pravděpodobnější: získání více než 60 procent hlavy ve třech vyletí mincí nebo získání více než 60 procent hlavy v 3000 vyletí.

* * *

další zajímavý příklad pochází z pokeru.

během krátké doby je štěstí důležitější než dovednost. Čím více štěstí přispívá k výsledku, tím větší vzorek budete muset rozlišovat mezi něčí dovedností a čistou šancí.

David Einhorn vysvětluje.

lidé se mě ptají “ Je poker štěstí?“a“ investuje štěstí?“

odpověď zní, vůbec ne. Ale na velikosti vzorku záleží. V daný den dobrý investor nebo dobrý hráč pokeru může přijít o peníze. Jakákoli investice do akcií se může ukázat jako poražená bez ohledu na to, jak velká je hrana. Totéž pro pokerovou kombinaci. Jeden pokerový turnaj se příliš neliší od soutěže o převrácení mincí a ani šestiměsíční investiční výsledky.

na tomto základě hraje roli štěstí. Ale v průběhu času – více než tisíce rukou proti různým hráčům a více než stovky investic v různých tržních prostředích-dovednost vyhrává.

Jako počet odehraných zvyšuje, dovednost hraje větší a větší roli a štěstí hraje menší roli.

* * *

ale to jde daleko nad rámec nemocnic a pokeru. Baseball je dalším dobrým příkladem. Během dlouhé sezóny, kurzy jsou nejlepší týmy povznesou na vrchol. V krátkodobém horizontu se může stát cokoli. Podíváte-li se na stojící 10 hry do sezóny, je pravděpodobné, že nebudou reprezentativní, kde se věci přistanou po plném 162 herní sezóny. Z krátkodobého hlediska hraje štěstí příliš velkou roli.

v Moneyballu Michael Lewis píše: „v sérii pěti her nejhorší tým v baseballu porazí nejlepší asi 15% času.“

* * *

pokud propagujete lidi nebo pracujete s kolegy, budete také chtít mít na paměti tuto zaujatost.

Pokud se domníváte, že výkon práce je kombinací dovednosti a štěstí, můžete snadno vidět, že velikost vzorku je relevantní pro spolehlivost výkonu.

že vzorkování výkonu funguje jako cokoli jiného, čím větší je velikost vzorku, tím větší je snížení nejistoty a tím je pravděpodobnější, že budete činit dobrá rozhodnutí.

toto studoval jeden z mých oblíbených myslitelů James March. Říká tomu efekt falešného záznamu.

píše:

efekt falešného záznamu. Skupina manažerů se stejnou (střední) schopností bude v krátkodobém horizontu vykazovat značné rozdíly ve svých výkonnostních záznamech. Některé budou nalezeny na jednom konci distribuce a budou považovány za vynikající; ostatní budou na druhém konci a budou považováni za neúčinné. Čím déle manažer zůstane v práci, tím menší je pravděpodobný rozdíl mezi pozorovaným záznamem výkonu a skutečnými schopnostmi. Čas na práci, zvýšila očekávaný vzorek pozorování, snížení očekávané výběrové chyby, a tím snižuje změnit, že manažer (nebo středně schopnost) bude buď povýšen, nebo exit.

Efekt Hrdiny. V rámci skupiny manažerů s různými schopnostmi, čím rychlejší je míra propagace, tím méně je pravděpodobné, že bude odůvodněna. Záznamy o výkonu jsou vytvářeny kombinací základních schopností a variací vzorkování. Manažeři, kteří mají dobré záznamy, mají větší pravděpodobnost vysoké schopnosti než manažeři, kteří mají špatné záznamy, ale spolehlivost diferenciace je malá, když jsou záznamy krátké.

(uvědomuji si, že propagace je mnohem komplikovanější,než si dovoluji. Některé práce jsou například obtížnější než jiné. To dostane chaotický rychle a to je součástí problému. Často, když se věci dostanou do nepořádku, vypneme mozek a vymyslíme nejjednodušší vysvětlení, jaké můžeme. Jednoduché, ale špatné. Poukazuji pouze na to, že velikost vzorku je jedním vstupem do rozhodnutí. Nejsem v žádném případě obhajovat přístup“ zkušenost je nejlepší“, protože to přichází s řadou dalších problémů.)

* * *

toto zkreslení se také používá proti vám v reklamě.

až příště uvidíte reklamu, která říká: „4 z 5 lékařů doporučuje ….“Tyto výsledky jsou bezvýznamné bez znalosti velikosti vzorku. Šance jsou docela dobré, že velikost vzorku je 5.

* * *

velké velikosti vzorků nejsou všelékem. Věci se mění. Systémy se vyvíjejí a víra v tyto výsledky může být také neopodstatněná.

klíčem je vždy myslet.

Tato zaujatost vede ke spoustě věcí, jako například:
– podle-odhadu rizika
– přes-odhad rizika
– zbytečného důvěru v trendy/vzory
– zbytečného důvěru v nedostatku vedlejší účinky/problémy

Zaujatost z necitlivosti k velikosti vzorku je součástí Farnam Ulici konstrukci mentálních modelů.

Tagged: Zaujatost z necitlivosti k regresi, Daniel Kahneman, David Einhorn, Falešný Záznam Účinek, Max Bazerman, Mentální Model, Statistiky

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.