표본 크기에 대한 무감각으로부터의 편향

무작위성에 대한 광범위한 오해는 많은 문제를 야기합니다.

오늘 우리는 인간의 오판을 많이 일으키는 개념을 탐구 할 것입니다. 이것은 표본 크기에 대한 무감각으로부터의 편향,또는 원하는 경우 작은 수의 법칙이라고합니다.

작은 표본 크기에 대한 무감각은 많은 문제를 야기합니다.

* * *

제가 6 피트를 측정 한 사람을 측정 한 다음 전 세계의 모든 사람들이 6 피트라고 말하면 직관적으로 이것이 실수라는 것을 깨달을 것입니다. 당신은 한 사람 만 측정 한 다음 그러한 결론을 도출 할 수 없다고 말할 것입니다. 그렇게 하려면 훨씬 더 큰 샘플이 필요합니다.

그리고 물론,당신은 옳을 것입니다.

간단하지만,이 예는 표본 크기에 대한 무감각이 우리를 어떻게 잘못 이끌 수 있는지에 대한 우리의 이해의 핵심 구성 요소입니다.

스투어드 수터랜드가 비합리성에 쓴 것처럼:

훨씬 많은 수의 이벤트(모집단)에서 선택된 제한된 수의 이벤트(샘플)에 대한 정보로부터 결론을 도출하기 전에 샘플의 통계에 대해 이해하는 것이 중요합니다.

대니얼 카너먼은”임의의 사건은 정의상 설명에 적합하지 않지만 무작위 사건의 집합은 매우 규칙적인 방식으로 행동한다.”카네 멘은 계속됩니다.”극단적 인 결과(높고 낮음)는 큰 샘플보다 작은 샘플에서 발견 될 가능성이 더 큽니다. 이 설명은 인과 관계가 아닙니다.”

우리 모두는 직관적으로”더 큰 표본의 결과는 더 작은 표본보다 더 많은 신뢰를받을 자격이 있으며,통계적 지식에 결백 한 사람들조차도 많은 수의 법칙에 대해 들었습니다.”

평균에 대한 회귀 원리는 표본 크기가 커짐에 따라 더 큰 결과가 안정적인 빈도로 수렴해야한다고 말합니다. 그래서 우리가 동전을 뒤집어서 앞면을 얻는 비율의 비율을 측정한다면,우리는 그것이 100 의 큰 표본 크기 후에 50%에 접근 할 것으로 예상하지만 반드시 2 또는 4 는 아닙니다.

우리의 마음 속에서,우리는 종종 주어진 표본 크기의 정확성과 불확실성을 설명하지 못합니다.

우리 모두는 직관적으로 이해하지만,처리 및 의사 결정의 순간에 큰 샘플이 작은 샘플보다 더 나은 표현임을 깨닫는 것은 어렵습니다.

우리는 6 과 6,000,000 의 표본 크기의 차이를 상당히 잘 이해하지만 직관적으로 200 과 3,000 의 차이를 이해하지 못합니다.

* * *

이 편견은 여러 형태로 제공됩니다.

노인 300 명을 대상으로 한 전화 조사에서 60%가 대통령을지지합니다.

이 문장의 메시지를 정확히 세 단어로 요약해야한다면,그들은 무엇입니까? 거의 확실하게 당신은”노인 지원 대통령을 선택할 것입니다.”이 말은 이야기의 요지를 제공합니다. 설문 조사의 생략 된 세부 사항,그것은 300 의 샘플과 함께 전화로 이루어졌다,그들 자신에 관심이 없다;그들은 약간의 관심을 끄는 배경 정보를 제공합니다.”물론 샘플이 극단적 인 경우 6 명이라고 말하면 질문 할 것입니다. 그러나 수학적으로 완전히 갖추어지지 않으면 샘플 크기를 직관적으로 판단 할 수 있으며 150 및 3000 의 샘플과 다르게 반응하지 않을 수 있습니다. 즉,간단히 말해서,”사람들은 표본 크기에 적절하게 민감하지 않습니다.”

문제의 일부는 우리가 결과의 신뢰성,또는 견고성에 대한 이야기에 초점을 맞추고 있다는 것입니다.

시스템 하나의 생각,즉 우리의 직관은”의심하는 경향이 없습니다. 그것은 모호성을 억제하고 가능한 한 일관된 이야기를 자발적으로 구성합니다. 메시지가 즉시 부정되지 않는 한,그것이 불러 일으키는 연관성은 메시지가 사실 인 것처럼 확산 될 것입니다.”

표본 크기를 고려하는 것은 극단적이지 않은 한 우리의 직관의 일부가 아닙니다.

칸만 글:

작은 샘플에 대한 과장된 믿음은보다 일반적인 환상의 한 예입니다-우리는 신뢰성에 대한 정보보다 메시지의 내용에 더 많은 관심을 지불하고,그 결과 데이터가 정당화하는 것보다 더 간단하고 일관된 우리 주변의 세계의 전망으로 끝납니다. 결론에 점프하는 것은 현실보다 우리의 상상력의 세계에서 안전한 스포츠입니다.

* * *

엔지니어링,예를 들어,우리는 전례의 평가에서이 발생할 수 있습니다.

스티븐 빅,믿음의 정도 쓰기:주관적 확률과 공학적 판단,쓰기:

뭔가 전에 일 하는 경우 추정은 실패 하지 않고 다시 작동 합니다. 즉,과거의 성공에 대한 미래의 성공 확률은 1.0 으로 간주됩니다. 따라서 지진에서 살아남은 구조는 동일한 크기와 거리로 생존 할 수 있다고 가정 할 것이며,근본적인 추정은 수술 적 인과 요인이 동일해야한다는 것입니다. 그러나 지진 지상 운동은 주파수 내용,감쇠 특성 및 기타 여러 요인에서 매우 다양하므로 단일 지진에 대한 선례는 매우 작은 표본 크기를 나타냅니다.

베이지안 사고는 다른 정보가 없는 한 번의 성공이 미래의 생존 가능성을 높인다고 말한다.

이 방법은 견고성과 관련이 있습니다. 더 당신이 처리 했어 그리고 당신은 여전히 당신이 더 강력한 생존.

다른 예를 살펴 보겠습니다.

* * *

병원

다니엘 카너먼과 아모스 트베르스키는 다음과 같은 질문으로 표본 크기에 대한 우리의 무감각을 보여 주었다:

특정 도시는 두 병원에 의해 제공됩니다. 큰 병원에서는 매일 약 45 명의 아기가 태어나고 작은 병원에서는 매일 약 15 명의 아기가 태어납니다. 아시다시피,모든 아기의 약 50%가 소년입니다. 그러나 정확한 비율은 매일 다릅니다. 때로는 50%보다 높을 수도 있고 때로는 낮을 수도 있습니다. 1 년 동안 각 병원은 태어난 아기의 60%이상이 소년 인 날을 기록했습니다. 어떤 병원 당신은 더 같은 일을 기록 생각하십니까?

큰 병원
작은 병원
거의 동일(즉,서로의 5%이내)

대부분의 사람들은 잘못 선택 3. 정답은 2.

경영 의사 결정 판단에서 맥스 바저만은 설명한다:

대부분의 사람들은 3 을 선택하며,두 병원은 60%이상이 소년 인 비슷한 일수를 기록 할 것으로 예상합니다. 사람들은 특정 방향으로 발생하는 무작위 사건의 60%를 갖는 것이 얼마나 특이한 지에 대한 기본적인 생각을 가지고있는 것 같습니다. 그러나 통계에 따르면 더 큰 샘플보다 작은 샘플에서 남성 아기의 60%를 관찰 할 가능성이 훨씬 높습니다.”이 효과는 이해하기 쉽습니다. 어느 것이 더 가능성이 있는지 생각해보십시오.: 동전 세 번 뒤집기에서 60%이상의 머리를 얻거나 3,000 번 뒤집기에서 60%이상의 머리를 얻습니다.

* * *

또 다른 흥미로운 예는 포커에서 비롯됩니다.

짧은 시간 동안 행운은 기술보다 더 중요합니다. 더 많은 행운이 결과에 기여할수록 다른 사람의 기술과 순수한 기회를 구별하는 데 필요한 샘플이 커집니다.

데이비드 아인혼이 설명한다.

사람들은 나에게 물어”포커 행운인가?”그리고”행운을 투자하고 있습니까?”

대답은 전혀 아닙니다. 그러나 샘플 크기가 중요합니다. 어떤 주어진 일에 좋은 투자자 또는 좋은 포커 플레이어는 돈을 잃을 수 있습니다. 큰 가장자리가 나타난다 비록 어떻게 해도 어떤 재고 투자는 분실자 이것을 끌 수 있는다. 포커 핸드도 마찬가지다. 하나의 포커 토너먼트는 동전 던지기 경연 대회와 크게 다르지 않으며 6 개월의 투자 결과도 아닙니다.

그 기초 행운이 역할을한다. 그러나 시간이 지남에 따라-플레이어의 다양한 시장 환경의 다양한 투자의 수백을 통해 손에 수천 이상-기술은 밖으로 승리.

연주 손의 수가 증가함에 따라,기술은 더 큰 역할을하고 행운은 덜 역할을한다.

* * *

그러나 이것은 병원과 포커를 넘어 길을 간다. 야구는 또 다른 좋은 예입니다. 긴 시즌 동안,확률은 최고의 팀이 정상에 상승 할 것이다. 짧은 시간에,아무것도 발생할 수 있습니다. 당신이 시즌에 서 10 게임을 보면,확률은 일이 전체 162 게임 시즌 후 착륙 할 곳을 대표하지 않을 것입니다. 단기적으로,행운은 너무 많은 역할을합니다.

머니볼에서 마이클 루이스는”5 경기 시리즈에서 야구에서 최악의 팀은 약 15%의 시간을 이길 것이다.”

* * *

당신이 사람들을 승진시키거나 동료와 일하는 경우에 당신은 또한 마음에 있는 이 편견을 지키고 싶을 것이다.

직장에서의 성과가 기술과 행운의 조합이라고 가정하면 샘플 크기가 성능의 신뢰성과 관련이 있음을 쉽게 알 수 있습니다.

성능 샘플링은 다른 것과 마찬가지로 작동하므로 표본 크기가 클수록 불확실성이 줄어들고 올바른 결정을 내릴 가능성이 높아집니다.

이것은 내가 가장 좋아하는 사상가 중 한 명인 제임스 3 월에 의해 연구되었습니다. 그는 그것을 거짓 기록 효과라고 부릅니다.

그는 쓴다:

거짓 기록 효과. 동일한(온건한)능력의 매니저의 그룹은 그들의 성과 기록에 있는 상당한 변이를 단기적으로 보여줄 것이다. 일부는 배포판의 한쪽 끝에서 발견 될 것이며 뛰어난 것으로 간주 될 것입니다; 다른 사람들은 다른 쪽 끝에있을 것이고 효과가없는 것으로 간주 될 것입니다. 관리자가 작업에 더 오래 머물수록 관찰 된 성과 기록과 실제 능력 사이의 가능한 차이는 줄어 듭니다. 작업 시간은 관찰의 예상 샘플을 증가 예상 샘플링 오류를 감소,따라서 관리자(또는 보통 능력)중 하나가 승진 또는 종료 될 변경 사항을 감소.

영웅 효과. 다양한 능력을 가진 관리자 그룹 내에서 승진 속도가 빠를수록 정당화 될 가능성이 적습니다. 성능 레코드는 기본 능력과 샘플링 변화의 조합에 의해 생성됩니다. 좋은 기록을 가진 관리자는 기록이 좋지 않은 관리자보다 높은 능력을 가질 가능성이 높지만 레코드가 부족할 때 차별화의 신뢰성은 떨어집니다.

(나는 승진이 나가 위에 시키고 있다보다는 아주 많게 복잡하다 것 을 실현한다. 예를 들어 일부 작업은 다른 작업보다 더 어렵습니다. 그것은 빨리 지저분 해지고 그 문제의 일부입니다. 종종 일이 지저분 해지면 우리는 두뇌를 끄고 우리가 할 수있는 가장 간단한 설명을 만듭니다. 단순하지만 잘못된. 나는 단지 샘플 크기가 결정에 하나의 입력이라는 것을 지적하고있다. 저것이 다른 문제 다수에 오기 때문에,나는 결코”경험 이다 제일”접근을 옹호해 이지 않는다.)

* * *

이 편견은 또한 광고에 당신에 대해 사용됩니다.

다음에”의사 5 명 중 4 명이 추천하는 광고를 볼 때….”이 결과는 표본 크기를 모른 채 의미가 없습니다. 확률은 샘플 크기가 꽤 좋다 5.

* * *

큰 표본 크기는 만병 통치약이 아닙니다. 상황이 바뀝니다. 시스템은 진화하고 그 결과에 대한 믿음뿐만 아니라 근거가 될 수 있습니다.

핵심은 언제나 생각하는 것이다.

이 편향은 다음과 같은 많은 것들을 초래합니다:
–과소 평가 위험
-과다 추정 위험
–추세/패턴에 대한 과도한 신뢰
-부작용/문제 부족에 대한 과도한 신뢰

표본 크기에 대한 무감각으로부터의 편향은 정신 모델의 파남 거리 격자 작업의 일부입니다.

태그: 회귀에 대한 무감각으로부터의 편향,다니엘 카너먼,데이비드 아인혼,거짓 기록 효과,맥스 바저 만,정신 모델,통계

정신 모델:표본 크기에 대한 무감각으로부터의 편향

답글 남기기 응답 취소