スピアマンの順位相関係数
数学および統計学では、スピアマンのランクの相関係数は、そのメーカー、チャールズ・スピアマンにちなんで名付けられた相関の測定である。それはギリシャの手紙rho (ρ {\displaystyle ✿rho } )として短く書かれる または時々r s {\displaystyle r_{s}}として.これは、2つのデータセットがどれだけ密接にリンクされているかを示す数値です。最高から最低の順に並べることができるデータにのみ使用できます。
ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{cfrac {6sum d^{2}}{n(n^{2}-1)}}}}}}}}}}}}}}}.
例えば、異なるコンピュータがどれだけ高いかのデータと、コンピュータがどれだけ速いかのデータがあれば、r s {displaystyle r_{s}}を使って、それらがリンクしているかどうかと、それらがどれだけ密接にリンクしているかを見ることができます。.
それを解決するために
ステップ1
r s {displaystyle r_{s}}を計算するには、まずデータの各部分に順位をつけなければならない。ここでは、コンピュータとその速度を例にする。
つまり、一番値段が安いパソコンはランク1になる。それより上のものは2になります。そして、それがすべてランク付けされるまで上昇していきます。これを両方のデータセットに対して行う必要があります。
価格 ($) | R a n k 1 {displaystyle Rank_{1}}} | 速度 (GHz) | R a n k 2 {displaystyle Rank_{2}}} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
ステップ2
次に、2つのランクの差を求めます。その差を乗算することを 二乗という。その差を d {displaystyle d}といい、 d {displaystyle d}を二乗したときに得られる数を d 2 {displaystyle d^{2}という。}.
R a n k 1 {displaystyle Rank_{1}}} | R a n k 2 {displaystyle Rank_{2}}} | d {displaystyle d}の | d 2 {displaystyle d^{2}}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
ステップ3
データの数を数えてみましょう。このデータには1から5までのランクがあるので、5個のデータがある。この数をn {displaystyle n} と呼ぶ。
ステップ4
最後に、これまでに計算してきたことをすべてこの式で使いましょう:r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {displaystyle r_{s}=1-{cfrac {6sum d^{2}}{n(n^{2}-1)}}}}}}。.
∑(゚Д゚)d 2 {\style d^2}}列にあった全ての数字の合計を 取るということだよ。.∑(゚Д゚)ノ Σ(゚Д゚)ノ Σ(゚Д゚)ノ Σ(゚Д゚)ノ
だから、∑ d 2 {displaystyle ¶sum d^{2}は、1 + 1 + 1 + 1 + 1 {displaystyle 1+1+1+1+1}で、4だ。 式では、それに6をかけて、24だ。
n (n 2 - 1 ) {\displaystyle n(n^{2}-1)} is 5 × (25 - 1 ) {\displaystyle 5times (25-1)} which is 120.
だから、r s {displaystyle r_{s}}を見つけるためにをするだけで、1 - 24 120 = 0.8 {displaystyle 1-{cfrac {24}{120}=0.8} .
したがって、このデータセットについては、スピアマンの順位相関係数は0.8です。
数字の意味
r s {\displaystyle r_{s}}は常に-1と1の間の答えを与える。 間の数字は目盛りのようなもので、-1は非常に強いリンク、0はリンクなし、1は非常に強いリンクである。1と-1の違いは、1は正の相関、-1は負の相関です。r s {\displaystyle r_{s}}の値が-1のデータのグラフは、線と点が左上から右下に向かっていることを除いて、示されているグラフのようになる。
例えば、先ほどのデータでは、r s {displaystyle r_{s}}は0.8でした。これは正の相関があることを意味する。1に近いということは、2つのデータの間に強いつながりがあることを意味している。つまり、この2つのデータはリンクしていて、一緒に上昇していると言えます。もしそれが-0.8だったら、リンクしていて、一方が上がればもう一方は下がると言えます。
2つの数字が同じ場合
データをランキングするときに、同じ数字が2つ以上あることがある。これがr s {displaystyle r_{s}}で起こった場合の場合、同じランクの平均または平均を取ります。これらは同点ランクと呼ばれます。これを行うには、同点の数字を、あたかも同点ではないかのようにランク付けします。次に、彼らが持っているであろうすべてのランクを加算し、どのくらいの数があるかでそれを割ります。例えば、スペルテストで異なる人々がどれだけうまくいったかをランキングしていたとします。
テストスコア | ランク | 順位(同点) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}}。 |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}}。 |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}=3}}。 |
8 | 5 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}}。 |
8 | 6 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}}。 |
これらの数値は、通常のランクと全く同じように使用されます。
関連ページ
質問と回答
Q:スピアマンの順位相関係数とは何ですか?
A:スピアマンの順位相関係数は、2つのデータセットがどれだけ密接にリンクしているかを示す相関性の尺度です。最高位から最低位までというように、順番に並べることができるデータにのみ使用することができます。
Q: スピアマンの順位相関係数は誰が作ったのですか?
A:チャールズ・スピアマンがスピアマンの順位相関係数を作成しました。
Q:スピアマンの順位相関係数の一般式はどのように書かれるのですか?
A:スピアマンの順位相関係数の一般式は、ρ = 1 - 6∑d2/n(n2-1) で表されます。
Q:スピアマンの順位相関係数はいつ使うべきですか?
A:スピアマンの順位相関係数は、2つのデータセットがどの程度密接にリンクしているか、またリンクしているかどうかを確認したいときに使用します。
Q:どのような種類のデータを扱うのですか?
A:高いものから低いものへと順番に並べることができるデータであれば、どのようなタイプのものでも使えます。
Q: この指標を使用する例を教えてください。
A: この尺度を使用する例として、異なるコンピュータがどれだけ高価かというデータと、コンピュータがどれだけ速いかというデータがある場合、r_sを使用して、それらがリンクしているかどうか、またどれだけ密接にリンクしているかを確認することができるだろう。