6.4。 潜在変数とは何ですか?¢

6.4.2. 室温

概念的には

あなたがいる部屋に4つの温度プローブがあり、30分ごとに局所温度をサンプリングして記録していると想像してください。 ここでは、4つの測定値が3日間にわたってどのように見えるかの例を示します。

../figures/examples/room-temperature/room-temperature-plots.py

表形式では、最初のいくつかの測定値は次のとおりです:

日付

\(x_1\)

\(x_2\)

\(x_3\)

\(x_4\)

金曜日11:00

金曜日11:30

金曜日12:00

12日(金):30

金曜日13:00

金曜日13:30

一般的な上下の変動は、room’sの温度の毎日の変化によるものです。 これらの4つの測定で記録されている単一の物理的現象は、室温の変動に過ぎません。

部屋の中央にさらに2つの温度計を追加した場合、これらの新しい測定値は他の4つの温度計と同じパターンを示すことが期待されます。 その点で、我々は部屋に好きなだけ多くの温度計を追加することができますが、我々は€™tは、各温度計との情報のいくつかの新しい、独立した部分を記録 すべての温度の読書を上下に運転する唯一の本当の変数がある:それは潜在的な変数である。

潜在変数が上下に動く原因を知る必要があることに注意してください(建物の太陽光の量であり、空調の設定である可能性があります)。 私たちが知っているのは、これらの温度測定値は、温度の上下の動きを駆動する根本的な現象を反映しているだけであるということです。

また、部屋の左下隅に記録された鋭いスパイクは、温度センサーの誤差が原因である可能性があります。 そして、部屋の前部は、ドアが長時間開いたままになっていたかもしれないので、ディップを示した。 これらの2つのイベントはデータの一般的な傾向に反するので、これらの期間が何らかの形で目立つことを期待して、それらを検出できます。

数学的に

部屋で起こっている出来事を要約したい場合は、記録された温度の平均を使用するだけです。 他の4つの元の温度測定値\(x_1,x_2,x_3\)と\(x_4\)を要約したこの新しい平均変数\(t_1\)と呼びましょう。\(x_1,x_2,x_3\)と\(x_4\)を計算します。\(x_1,x_2,x_3\)と\(x_4\)を

\

それぞれの重みに適した値は、\(p_{1,1}=p_{2,1}=p_{3,1}=p_{4,1}=1/4\)です。数学的には、これを言う正しい方法は、\(t_1\)は、重み(\(p_{1,1},p_{2,1},p_{3,1},p_{4,1}\))で与えられる生の測定値(\(x_1,x_2,x_3\)と\(x_4\)の線形結合である

幾何学的には

このシステムからのデータをいくつかの方法で視覚化できますが、単純に最初の3つの温度の3次元表現を表示します:\(x_1,x_2,x_3\)。

../figures/examples/room-temperature/room-temperature-plots-combine.py

3つのプロットは、異なる視点から同じデータセットを示しています。 各観測値は単一のドットであり、その位置は記録された温度\(x_1,x_2\)および\(x_3\)の値によって決定されます。 この表現は、次のセクションで再び使用します。

データがどのように相関しているかに注意してください:cube’sの内部を横切って対角線を形成し、うわさ€™tはこの傾向に従ういくつかの外れ値(上

このセクションの主なポイントは次のとおりです:

  • 潜在的な変数は、何らかの方法で、調査されているシステムの根底にある現象をキャプチャします。

  • システム内の潜在変数を計算した後、生データの\(K\)列の代わりに、これらのより少ない数の変数を使用できます。 これは、実際の測定値が潜在変数と相関しているためです。

これまでに与えられた例は、単一の潜在変数が何であるかを示しました。 実際には、通常、データ配列に対していくつかの潜在変数を取得します。 この段階ではまれてご質問など“how多くの潜在変数がありまmatrixâユーロの製品および“howの価値\(\mathbf{P}\)chosenâユーロの製品は、“howいこの潜在変数は概要のdataâ€ってい?

これらの問題については、主成分分析に関する次のセクションでより正式に対処します。

コメントを残す

メールアドレスが公開されることはありません。