シンプソンのパラドックス

シンプソンのパラドックスとは、統計学のパラドックスである。1951年に初めて記述したイギリスの統計学者エドワード・H・シンプソンにちなんで命名された。統計学者のカール・ピアソンは1899年に非常によく似た効果を記述している - ウドニー・ユールの記述は1903年である。ユール-シンプソン効果と呼ばれることもある。集団の統計的な得点を見るとき、集団を一つずつ見るか、まとめて大きな集団にするかによって、得点が変わることがある。このケースは社会科学や医学の統計学でよく起こります。因果関係を説明するために頻度データを使用した場合、人々を混乱させることがある。このパラドックスの別称として、反転パラドックスアマルガムパラドックスなどがある

例腎臓結石治療

これは、腎臓結石に対する2つの治療法の成功率を比較した医学研究の実例である。

この表は、小さな腎臓結石と大きな腎臓結石を含む治療の成功率と治療回数を示しており、治療Aはすべての開腹手術、治療Bは経皮的腎臓結石摘出術を含んでいます。

トリートメントA

トリートメントB

成功

ふりょう

成功

ふりょう

小石

グループ1

グループ2

患者数

81

6

234

36

93%

7%

87%

13%

大きな石

グループ3

グループ4

患者数

192

71

55

25

73%

27%

69%

31%

両方

グループ1+3

グループ2+4

患者数

273

77

289

61

78%

22%

83%

17%

治療法Aは小さな結石に使用した場合、また大きな結石に使用した場合にも有効であるが、両方のサイズを同時に考慮すると治療法Bの方が有効であるという逆説的な結論になるのである。この例では、腎臓結石の大きさが結果に影響することは知られていませんでした。これを統計学では隠れた変数(lurking variable)といいます。

どちらの治療が優れているかは、2つの比率(成功数/合計)の不等式によって決定される。シンプソンのパラドックスを引き起こす比率の不等号の逆転は、2つの効果が同時に起こるために起こります。

  1. 潜んでいる変数を無視したときに組み合わされるグループの大きさは、非常に異なっているのです。医師は重症例(大きな結石)にはよりよい治療(A)を、軽症例(小さな結石)にはより劣った治療(B)を施す傾向がある。したがって、合計は第3グループと第2グループに支配され、はるかに小さい第1グループと第4グループには支配されない。
  2. 潜伏変数が比率に大きな影響を与える、つまり、成功率は治療法の選択よりも症例の重症度に強く影響されるのである。したがって、治療法Aを用いた結石の大きい患者群(第3群)は、たとえ劣る治療法B(第2群)を用いたとしても、結石の小さい患者群よりも成績が悪くなる。

AlegsaOnline.com - 2020 / 2023 - License CC3