modelo Mental: viés da insensibilidade ao tamanho Da Amostra

a compreensão generalizada da aleatoriedade causa muitos problemas.Hoje vamos explorar um conceito que causa muitos erros humanos. Chama-se o preconceito da insensibilidade ao tamanho da amostra, ou, se preferir,a lei dos pequenos números.A insensibilidade a pequenos tamanhos de amostra causa muitos problemas.

* * *

Se eu medi uma pessoa, que passou a medir 6 metros e, em seguida, disse que todo mundo no mundo inteiro foi de 6 metros, você intuitivamente percebem que esse é um engano. Você diria que não pode medir apenas uma pessoa e então tirar tal conclusão. Para isso, precisaria de uma amostra muito maior.E, claro, teria razão.

embora simples, este exemplo é um elemento fundamental para o nosso entendimento de como a insensibilidade ao tamanho da amostra pode nos levar a um erro.Como Stuard Suterhland escreve em irracionalidade:

Antes de tirar conclusões a partir de informações sobre um número limitado de eventos (uma amostra), selecionadas a partir de um número muito maior de eventos (população) é importante para entender algo sobre as estatísticas das amostras.

ao pensar, rápido e lento, Daniel Kahneman escreve “um evento aleatório, por definição, não se presta a explicações, mas coleções de eventos aleatórios se comportam de forma altamente regular.”Kahnemen continua,” resultados extremos (altos e baixos) são mais propensos a serem encontrados em pequenas amostras do que em grandes amostras. Esta explicação não é causal.”

todos nós sabemos intuitivamente que ” os resultados de amostras maiores merecem mais confiança do que amostras menores, e mesmo as pessoas que são inocentes do conhecimento estatístico ouviram sobre esta lei de grandes números.”

The principle of regression to the mean says that as the sample size grows larger results should converge to a stable frequency. Então, se estamos atirando moedas, e medindo a proporção de vezes que recebemos cabeças, esperaríamos que se aproximasse 50% depois de uma grande amostra de, digamos, 100, mas não necessariamente 2 ou 4.Em nossas mentes, muitas vezes não explicamos a exatidão e a incerteza com um determinado tamanho de amostra.Embora todos o entendamos intuitivamente, é difícil para nós perceber no momento do processamento e da tomada de decisões que amostras maiores são melhores representações do que amostras menores.

compreendemos a diferença entre um tamanho de amostra de 6 e 6.000.000 bastante bem, mas não entendemos, intuitivamente, a diferença entre 200 e 3.000.

* * *

este preconceito vem em muitas formas.Numa sondagem telefónica de 300 idosos, 60% apoiam o presidente.Se você tivesse que resumir a mensagem desta frase em exatamente três palavras, quais seriam? Quase de certeza que escolheria “presidente de apoio aos idosos”.”Estas palavras fornecem a essência da história. Os detalhes omitidos da pesquisa, que foi feito no telefone com uma amostra de 300, não são de interesse em si mesmos; eles fornecem informações de fundo que atrai pouca atenção.”Claro, se a amostra fosse extrema, digamos 6 pessoas, você a questionaria. A menos que você esteja totalmente equipado matematicamente, no entanto, você vai intuitivamente avaliar o tamanho da amostra e você não pode reagir de forma diferente a uma amostra de, digamos, 150 e 3000. Isso, em poucas palavras, é exatamente o significado da afirmação de que “as pessoas não são adequadamente sensíveis ao tamanho da amostra.”

parte do problema é que nos concentramos na história sobre a confiabilidade, ou, robustez, dos resultados.Sistema um pensamento, que é a nossa intuição, não é “propenso à dúvida”. Suprime a ambiguidade e constrói espontaneamente histórias que são tão coerentes quanto possível. A menos que a mensagem seja imediatamente negada, as associações que evoca se espalharão como se a mensagem fosse verdadeira.”

considerando o tamanho da amostra, a menos que seja extremo, não faz parte da nossa intuição.

Kahneman escreve:

A exagerada fé em amostras pequenas é apenas um exemplo de uma mais geral ilusão – nós pagamos mais atenção para o conteúdo das mensagens que a informação sobre a sua confiabilidade, e, como resultado, acabam com uma visão do mundo que nos cerca, que é mais simples e mais coerente do que os dados justificar. Tirar conclusões precipitadas é um desporto mais seguro no mundo da nossa imaginação do que é na realidade.

* * *

Na engenharia, por exemplo, podemos encontrar isso, na avaliação do precedente.Steven Vick, escrevendo em graus de crença: probabilidade subjetiva e julgamento de Engenharia, escreve:

se alguma coisa já funcionou antes, a presunção é que voltará a funcionar sem falhas. Ou seja, a probabilidade de sucesso futuro condicionada ao sucesso passado é tomada como 1.0. Assim, presume-se que uma estrutura que sobreviveu a um sismo é capaz de sobreviver com a mesma magnitude e distância, com a presunção subjacente de que os fatores causais operativos devem ser os mesmos. Mas os movimentos sísmicos do solo são bastante variáveis em seu conteúdo de Frequência, Características de atenuação, e muitos outros fatores, de modo que um precedente para um único terremoto representa um tamanho de amostra muito pequeno.O pensamento Bayesiano nos diz que um único sucesso, ausente de outras informações, aumenta a probabilidade de sobrevivência no futuro.

de certa forma, isto está relacionado com a robustez. Quanto mais você tiver que lidar e você ainda sobreviver, mais robusto você é.

vamos olhar para alguns outros exemplos.

* * *

Hospital

Daniel Kahneman e Amos Tversky demonstrou nossa insensibilidade ao tamanho da amostra com a seguinte pergunta:

Uma determinada cidade é servida por dois hospitais. No hospital maior, cerca de 45 bebês nascem todos os dias, e no hospital menor cerca de 15 bebês nascem todos os dias. Como sabem, cerca de 50% de todos os bebés são rapazes. No entanto, a porcentagem exata varia de dia para dia. Às vezes pode ser superior a 50%, às vezes inferior. Por um período de 1 ano, cada hospital registrou os dias em que mais de 60% dos bebês nascidos eram meninos. Que hospital achas que gravou mais dias assim?

  1. o hospital maior
  2. o hospital mais pequeno
  3. aproximadamente o mesmo (isto é, dentro de 5% um do outro)

a maioria das pessoas escolhe incorretamente 3. A resposta correta é, no entanto, 2.O advogado-geral J. Mischo apresentou as suas conclusões na audiência da sexta secção de 16 de Dezembro de 2001.:

a maioria dos indivíduos escolhe 3, esperando que os dois hospitais registrem um número semelhante de dias em que 60 por cento ou mais da placa de bebês são meninos. As pessoas parecem ter alguma idéia básica de como é incomum ter 60 por cento de um evento aleatório ocorrendo em uma direção específica. No entanto, as estatísticas nos dizem que temos muito mais probabilidade de observar 60 por cento dos bebês do sexo masculino em uma amostra menor do que em uma amostra maior.”Este efeito é fácil de entender. Pense sobre o que é mais provável: obter mais de 60 por cento de cabeças em três jogadas de moeda ou obter mais de 60 por cento de cabeças em 3.000 jogadas.

* * *

outro exemplo interessante vem do Poker.Durante curtos períodos de tempo, a sorte é mais importante do que a habilidade. Quanto mais Sorte contribuir para o resultado, maior a amostra que você vai precisar para distinguir entre a habilidade de alguém e puro acaso.

David Einhorn explica.

as pessoas perguntam-me ” é sorte de poker?”e” investir é sorte?”

a resposta é, de modo algum. Mas os tamanhos das amostras importam. Em qualquer dia um bom investidor ou um bom jogador de poker pode perder dinheiro. Qualquer investimento de ações pode acabar por ser um perdedor, não importa o quão grande a borda aparece. O mesmo para uma mão de póquer. Um torneio de poker não é muito diferente de um concurso de troca de moedas e nem seis meses de resultados de investimento.

nessa base, a sorte desempenha um papel. Mas com o tempo – mais de milhares de mãos contra uma variedade de jogadores e mais de centenas de investimentos em uma variedade de ambientes de mercado – a habilidade ganha.

como o número de mãos desempenhadas aumenta, a habilidade desempenha um papel maior e maior e a sorte desempenha menos de um papel.

* * *

mas isto vai muito além dos hospitais e do póquer. O basebol é outro bom exemplo. Ao longo de uma longa temporada, as chances são as melhores equipes vão subir para o topo. A curto prazo, tudo pode acontecer. Se você olhar para os 10 jogos em pé na temporada, as probabilidades são que eles não serão representativos de onde as coisas vão pousar após a temporada de 162 jogos completo. A curto prazo, a sorte desempenha um papel demasiado importante.Em Moneyball, Michael Lewis escreve: “em uma série de cinco jogos, o pior time do beisebol vai bater o melhor cerca de 15% das vezes.”

* * *

se você promover pessoas ou trabalhar com colegas Você também vai querer manter este preconceito em mente.

se você assumir que o desempenho no trabalho é alguma combinação de habilidade e sorte você pode facilmente ver que o tamanho da amostra é relevante para a confiabilidade do desempenho.

que a amostragem de desempenho funciona como qualquer outra coisa, quanto maior o tamanho da amostra maior a redução na incerteza e mais provável Você está a tomar boas decisões.Isto foi estudado por um dos meus pensadores favoritos, James March. Ele chama-lhe o falso efeito de Registo.

ele escreve:

falso efeito de Registo. Um grupo de gestores de capacidade idêntica (moderada) mostrará uma variação considerável nos seus registos de desempenho a curto prazo. Alguns serão encontrados em uma extremidade da distribuição e serão vistos como outstanding; outros estarão do outro lado e serão vistos como ineficazes. Quanto mais tempo um gerente permanecer em um trabalho, menos a diferença provável entre o registro observado do desempenho e a capacidade real. O tempo de trabalho aumentou a amostra esperada de observações, reduziu o erro de amostragem esperado e, assim, reduziu a mudança que o gerente (ou habilidade moderada) será promovido ou sair.

Efeito Herói. No seio de um grupo de gestores com diferentes capacidades, quanto mais rápida for a taxa de promoção, menos provável será a sua justificação. Os registos de desempenho são produzidos por uma combinação da capacidade subjacente e da variação da amostragem. Os gerentes que têm bons registros são mais propensos a ter alta capacidade do que os gerentes que têm maus registros, mas a confiabilidade da diferenciação é pequena quando os registros são curtos.

(sei que as promoções são muito mais complicadas do que estou a dizer. Alguns empregos, por exemplo, são mais difíceis do que outros. Fica confuso rapidamente e isso faz parte do problema. Muitas vezes, quando as coisas se complicam, desligamos os nossos cérebros e inventamos a explicação mais simples possível. Simples, mas errado. Só estou a dizer que o tamanho da amostra é uma entrada para a decisão. Não estou de modo algum defendendo uma abordagem” experiência é melhor”, pois isso vem com uma série de outros problemas.)

* * *

este preconceito também é usado contra você na publicidade.

da próxima vez que você ver um comercial que diz ” 4 de 5 médicos recomendam … “Estes resultados são insignificantes sem saber o tamanho da amostra. As probabilidades são boas de o tamanho da amostra ser 5.

* * *

as grandes amostras não são uma panaceia. As coisas mudam. Os sistemas evoluem e a fé nesses resultados também pode ser infundada.

a chave, em todos os momentos, é pensar.

Esse preconceito leva a toda uma série de coisas, tais como:
– sob-a estimativa de risco
– sobre-estimar o risco
– confiança indevida em tendências/padrões
– indevida a confiança na falta de efeitos colaterais/problemas

O Viés de insensibilidade ao tamanho da amostra é a parte da Farnam Rua treliça de modelos mentais.

marcado: Viés da insensibilidade à regressão, Daniel Kahneman, David Einhorn, False Record Effect, Max Bazerman, Mental Model, Statistics

Deixe uma resposta

O seu endereço de email não será publicado.