6.4. O que é uma variável latente?

6.4.2. O quarto tem 4 sondas de temperatura que recolhem amostras e registam a temperatura local a cada 30 minutos. Aqui está um exemplo do que as quatro medidas podem parecer mais de 3 dias. ../figures/examples/room-temperature/room-temperature-plots.py na forma de tabela, as primeiras medições são:

Data

\(x_1\)

\(x_2\)

\(x_3\)

\(x_4\)

Sexta-Feira 11:00

Sexta-Feira 11:30

Sexta-Feira 12:00

Sexta-Feira 12:30

Sexta-Feira 13:00

Sexta-Feira 13:30

geral, para cima e para baixo variações são devido à alteração diária no room’s de temperatura. O fenômeno físico único que está sendo registrado nestas quatro medições é apenas a variação na temperatura ambiente.Se acrescentássemos mais dois Termómetros no meio da sala, esperaríamos que estas novas medições mostrassem o mesmo padrão que as outras quatro. A esse respeito, podemos adicionar tantos Termómetros como gostamos da sala, mas won’t estar a gravar alguma nova, independente peça de informação com cada termómetro. Há apenas uma variável verdadeira que impulsiona todas as leituras de temperatura para cima e para baixo: é uma variável latente.

Notice that we don’t necessarily have to know what causes the latent variable to move up and down (it could be the amount of sunlight on the building; it could be the air-conditioner’s settings). Tudo o que sabemos é que essas medições de temperatura apenas refletem o fenômeno subjacente que impulsiona os movimentos para cima e para baixo na temperatura; elas estão correlacionadas com a variável latente.Note também que o pico nítido registado no canto esquerdo da sala pode ser devido a um erro no sensor de temperatura. E a parte da frente da sala mostrou um mergulho, talvez porque a porta foi deixada aberta por um longo período; mas não o suficiente para afetar as outras leituras de temperatura. Estes dois eventos vão contra a tendência geral dos dados, então esperamos que esses períodos de tempo se destacam de alguma forma, para que possamos detectá-los.Matematicamente, se quiséssemos resumir os eventos que ocorrem na sala, poderíamos apenas usar a média das temperaturas registradas. Let’s chamar esta nova variável média \(t_1\), que resume as outras quatro medições de temperatura originais \(x_1, x_2, x_3\) e \(x_4\).

\

e os valores adequados para cada um dos pesos são \(p_{1,1} = p_{2,1} = p_{3,1} = p_{4,1} = 1/4\).

Matematicamente a forma correta de dizer isso é que \(t_1\) é uma combinação linear das matérias medições (\(x_1, x_2, x_3\) e \(x_4\)) dada pelos pesos (\(p_{1,1}, p_{2,1}, p_{3,1}, p_{4,1}\)).

geometricamente

podemos visualizar os dados deste sistema de várias formas, mas vamos simplesmente mostrar uma representação 3-D das primeiras 3 temperaturas: \(x_1, x_2, x_3\).

 ../figures/examples/room-temperature/room-temperature-plots-combine.py

as 3 parcelas mostram o mesmo conjunto de dados, apenas de diferentes pontos de vista. Cada observação é um ponto único, cuja localização é determinada pelos valores registados de temperatura, \(x_1, x_2\) e \(x_3\). Vamos usar esta representação na próxima seção novamente.

Note como os dados parecem correlacionados: formando uma linha diagonal através do interior do cube’s, com alguns anómalos (descritos acima) que don’t obedecer a esta tendência.Os pontos principais desta secção são::

  • variáveis latentes capturam, de alguma forma, um fenômeno subjacente no sistema que está sendo investigado.

  • depois de calcular as variáveis latentes em um sistema, podemos usar este menor número de variáveis, em vez das colunas \(K\) de dados brutos. Isto porque as medições reais estão correlacionadas com a variável latente.

os exemplos dados até agora mostraram o que é uma única variável latente. Na prática, normalmente obtemos várias variáveis latentes para uma matriz de dados. Nesta fase você provavelmente tem mais perguntas, como “quantas variáveis latentes existem em uma matriz” e “como são os valores em \(\mathbf{P}\) Chosen”, e “como sabemos que essas variáveis latentes são um bom resumo dos dados originais”?Abordamos estas questões de forma mais formal na próxima secção sobre a análise dos principais componentes.

Deixe uma resposta

O seu endereço de email não será publicado.