6.4. Cos’è una variabile latente?¶

6.4.2. Temperatura ambiente¶

Concettualmente

Immagina che la stanza in cui ti trovi abbia 4 sonde di temperatura che campionano e registrano la temperatura locale ogni 30 minuti. Ecco un esempio di come potrebbero apparire le quattro misurazioni in 3 giorni.

 ../figures/examples/room-temperature/room-temperature-plots.py

In forma di tabella, le prime misurazioni sono:

Data

\(x_1\)

\(x_2\)

\(x_3\)

\(x_4\)

Venerdì 11:00

Venerdì 11:30

Venerdì 12:00

Venerdì 12:30

Venerdì 13:00

Venerdì 13:30

Il generale su e giù per le fluttuazioni sono dovute al cambio giornaliero in room’s di temperatura. Il singolo fenomeno fisico registrato in queste quattro misurazioni è solo la variazione della temperatura ambiente.

Se aggiungessimo altri due termometri al centro della stanza, ci aspetteremmo che queste nuove misurazioni mostrassero lo stesso schema degli altri quattro. A questo proposito possiamo aggiungere come molti termometri come ci piace alla stanza, ma abbiamo won’t essere la registrazione di qualche nuovo, pezzo indipendente di informazioni con ogni termometro. C’è solo una vera variabile che guida tutte le letture di temperatura su e giù: è una variabile latente.

Si noti che noi donâ € ™t necessariamente devono sapere che cosa provoca la variabile latente di muoversi su e giù (potrebbe essere la quantità di luce solare sull’edificio; potrebbe essere l’aria condizionata-conditioner’s impostazioni). Tutto quello che sappiamo è che queste misurazioni della temperatura riflettono solo il fenomeno sottostante che guida i movimenti su e giù della temperatura; sono correlati con la variabile latente.

Avviso anche il picco acuto registrato nell’angolo posteriore sinistro della stanza potrebbe essere dovuto a un errore nel sensore di temperatura. E la parte anteriore della stanza ha mostrato un tuffo, forse perché la porta è stata lasciata aperta per un periodo prolungato; ma non abbastanza a lungo per influenzare le altre letture di temperatura. Questi due eventi vanno contro la tendenza generale dei dati, quindi ci aspettiamo che questi periodi di tempo si distinguano in qualche modo, in modo da poterli rilevare.

Matematicamente

Se volessimo riassumere gli eventi che si svolgono nella stanza potremmo semplicemente usare la media delle temperature registrate. Letâ € ™s chiamare questo nuovo, variabile media \(t_1\), che riassume le altre quattro misure di temperatura originali \(x_1, x_2, x_3\) e \(x_4\).

\

e i valori adatti per ciascuno dei pesi sono \(p_{1,1} = p_{2,1} = p_{3,1} = p_ {4,1} = 1/4\).

Matematicamente il modo corretto per dirlo è che \(t_1\) è una combinazione lineare delle misure grezze (\(x_1, x_2, x_3\) e \(x_4\)) date dai pesi (\(p_{1,1}, p_{2,1}, p_{3,1}, p_{4,1}\)).

Geometricamente

Possiamo visualizzare i dati da questo sistema in diversi modi, ma mostreremo semplicemente una rappresentazione 3D delle prime 3 temperature: \(x_1, x_2, x_3\).

 ../figures/examples/room-temperature/room-temperature-plots-combine.py

I 3 grafici mostrano lo stesso insieme di dati, solo da diversi punti di vista. Ogni osservazione è un singolo punto, la cui posizione è determinata dai valori registrati di temperatura, \(x_1, x_2\) e\(x_3\). Useremo di nuovo questa rappresentazione nella prossima sezione.

Si noti come correlati i dati appaiono: formando una linea diagonale attraverso il cubeâ € ™s interno, con alcuni valori anomali (sopra descritti) che don’t obbedire a questa tendenza.

I punti principali di questa sezione sono:

  • Le variabili latenti catturano, in qualche modo, un fenomeno sottostante nel sistema oggetto di indagine.

  • Dopo aver calcolato le variabili latenti in un sistema, possiamo usare questi un minor numero di variabili, invece delle colonne \(K\) dei dati grezzi. Questo perché le misurazioni effettive sono correlate con la variabile latente.

Gli esempi forniti finora hanno mostrato cos’è una singola variabile latente. In pratica di solito otteniamo diverse variabili latenti per un array di dati. In questa fase probabilmente avete più domande, come “quanto molte variabili latenti ci sono in una matrix” e â € œhow sono i valori in\ (\mathbf{P}\) chosen”, e â € œhow sappiamo che queste variabili latenti sono un buon riassunto dei dati originali?

Affrontiamo questi problemi in modo più formale nella prossima sezione sull’analisi dei componenti principali.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.