6.4. Co to jest zmienna utajona?

6.4.2. Temperatura pokojowaâ¶

koncepcyjnie

wyobraź sobie, że pokój, w którym jesteś, ma 4 Sondy temperatury, które pobierają i rejestrują lokalną temperaturę co 30 minut. Oto przykład tego, jak te cztery pomiary mogą wyglądać w ciągu 3 dni.

 ../figures/examples/room-temperature/room-temperature-plots.py

w formie tabeli pierwsze kilka pomiarów to:

Data

\(x_1\)

\(x_2\)

\(x_3\)

\(x_4\)

piątek 11:00

piątek 11:30

piątek 12:00

piątek 12:30

piątek 13:00

piątek 13:30

ogólne wahania w górę iw dół są ze względu na codzienną zmianę temperatury w pokoju. Pojedyncze, fizyczne zjawisko rejestrowane w tych czterech pomiarach to tylko zmienność temperatury pokojowej.

gdybyśmy dodali jeszcze dwa termometry na środku pomieszczenia, spodziewalibyśmy się, że te nowe pomiary pokażą ten sam wzór, co pozostałe cztery. Pod tym względem moĹĽemy dodaÄ ‡ do pokoju tyle termometrăłw, ile chcemy, ale z kaĺľdym termometrem nie bÄ ™ dziemy nagrywaÄ ‡ nowej, niezaleĺľnej informacji. Istnieje tylko jedna prawdziwa zmienna, która napędza wszystkie odczyty temperatury w górę iw dół: jest to zmienna utajona.

zauważ, że nie musimy koniecznie wiedzieć, co powoduje, że zmienna utajona porusza się w górę iw dół (może to być ilość światła słonecznego na budynku; może to być Ustawienia klimatyzatora). Wiemy tylko, że te pomiary temperatury odzwierciedlają podstawowe zjawisko, które napędza ruchy temperatury w górę i w dół; są one skorelowane ze zmienną utajoną.

zauważ również ostry skok zarejestrowany w lewym tylnym rogu pomieszczenia może być spowodowany błędem czujnika temperatury. Przednia część pomieszczenia była zanurzona, może dlatego, że drzwi były otwarte przez dłuższy czas, ale nie na tyle długo, aby wpłynąć na inne odczyty temperatury. Te dwa zdarzenia są sprzeczne z ogólnym trendem danych, więc oczekujemy, że te okresy czasu będą się w jakiś sposób wyróżniać, abyśmy mogli je wykryć.

matematycznie

jeśli chcemy podsumować wydarzenia zachodzące w pomieszczeniu, możemy po prostu użyć średniej zarejestrowanych temperatur. Nazwijmy tę nową, średnią zmienną \(t_1\), która podsumowuje pozostałe cztery oryginalne pomiary temperatury \(x_1, x_2, x_3\) i \(x_4\).

\

odpowiednie wartości dla każdej z wag to \(p_{1,1} = p_{2,1} = p_{3,1} = p_{4,1} = 1/4\).

matematycznie poprawny sposób, aby powiedzieć, że \(t_1\) jest liniową kombinacją surowych pomiarów (\(x_1, x_2, x_3\) i \(x_4\)) podanych przez wagi (\(p_{1,1}, p_{2,1}, p_{3,1}, p_{4,1}\)).

geometrycznie

możemy wizualizować dane z tego systemu na kilka sposobów, ale po prostu pokażemy trójwymiarową reprezentację pierwszych 3 temperatur: \(x_1, x_2, x_3\).

 ../figures/examples/room-temperature/room-temperature-plots-combine.py

3 wykresy pokazują ten sam zestaw danych, tylko z różnych punktów widzenia. Każda obserwacja jest pojedynczą kropką, której położenie jest określone przez zarejestrowane wartości temperatury, \(x_1, x_2\) i \(x_3\). Ponownie użyjemy tej reprezentacji w następnej sekcji.

zauważ, jak skorelowane dane pojawiają się: tworząc ukośną linię przez wnętrze sześcianu, z kilkoma odstającymi (opisanymi powyżej), które nie przestrzegają tego trendu.

główne punkty z tej sekcji to:

  • zmienne utajone wychwytują w pewien sposób zjawisko leżące u podstaw badanego systemu.

  • po obliczeniu zmiennych utajonych w systemie, możemy użyć mniejszej liczby zmiennych, zamiast kolumn\ (K\) surowych danych. Dzieje się tak, ponieważ rzeczywiste pomiary są skorelowane ze zmienną utajoną.

podane do tej pory przykłady pokazały, czym jest pojedyncza zmienna utajona. W praktyce zwykle otrzymujemy kilka zmiennych utajonych dla tablicy danych. Na tym etapie prawdopodobnie masz więcej pytań, takich jak â € œhow wiele zmiennych utajonych są tam w matrix†i â € œhow są wartości w\ (\mathbf{p}\) chosenâ€, i â € œhow wiemy, że te zmienne utajone są dobre podsumowanie oryginalnych dataâ€?

rozwiązujemy te problemy bardziej formalnie w następnej sekcji poświęconej analizie głównych komponentów.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.