【看護師が解説】交絡因子、潜在変数とは?

看護師の皆さん、統計が苦痛になっていないですか?

今回は統計学の中でも超重要な潜在変数について説明していきます。

「潜在変数ってなに?」「具体例は?」という部分を本記事にて説明しています。

また論文での使われ方も書いています。私も大学院で苦労しましたので、できるだけわかりやすく書きました。一緒に勉強していきましょう。

※そもそも統計が全然わからないという方は、「統計学が最強の学問である」という本がおすすめです。レビュー記事のリンクはこちらです。

スポンサーリンク

交絡因子、潜在変数とは

この2つは同じものを指しています。でも学校の資料とか、統計の本とかを見てもわからないということが多いと思います。まずは次の例を考えてみましょう。

アイスクリームが売れると溺れる人が増える???

仮にアイスクリームがよく売れた日は溺れる人も増えるというデータがあるとします。

それでは、溺れる人を減らすためにアイスクリームを売れないようにするということにしましょうか。

…これ間違ってますよね。

あたかも「アイスクリームの売上」と「溺れる人の人数」には原因と結果の関係があるように見えます。しかし、実際には因果関係はありません。このような関係のことを疑似相関といいます。

疑似相関について詳しく書いた記事はこちら

アイスクリームのケースは、潜在変数のために、因果関係があるように見えるというパターンです。(別のパターンは↑の記事にて説明しています。)

もう少し詳しく見てみましょう。

このケースに原因と結果の関係があるようにえる理由は、「気温」という潜在変数が関わっているからです。

アイスクリームがよく売れた日は溺れる人も増えるというデータは

このように読み解けますが、実際は

このような関係になっているのです。

別の書き方をすると

これは正しくなく

これが正しい解釈

という感じです。

交絡因子、潜在変数の定義

アイスクリームの例でいうところの、「気温」を交絡因子または潜在変数といいます。「アイスクリームの売上」と「溺れる人の人数」を比較する上で、「気温」という因子は次の3つの条件を満たします。

  • 「溺れる人の人数」という結果(にみえてしまうもの)に影響を与える
  • 「アイスクリームの売上」と相関がある
  • 「アイスクリームの売上」が上がる→「気温」が上がる→「溺れる人の人数」も増えるという関係ではない

この3つの条件を満たすので、「気温」は交絡因子(潜在変数)といえます。

つまり交絡因子、潜在変数は次のように定義されています。(日本疫学会の定義を引用)

交絡因子とは、2つの集団のアウトカムを比較する際にあらわれる変数で、次の3つの条件を満たす。

  • アウトカムに影響を与える
  • 要因と関連がある
  • 要因とアウトカムの中間因子でない

この定義の部分はなんとなくわかったようでわかっていない感覚があると思います。(過去の私もそうでした)
何度もこの定義に戻ることで自分で使いこなせるようになります。それまで何度も、実際のデータと突き合わせながら勉強していくとよいと思います。

交絡の他の例

頭を柔らかくするために他の例も挙げていきましょう。

医学系の講義でよく取り上げられるのは次の2つです。(大学生のときはこの例を使って学びました)

「コーヒーが原因で肺がんが増える」のは間違い

正しくは、「実際は喫煙してる人がコーヒーも飲むし、肺がんになりやすい」ということであり、喫煙が交絡因子

「高血圧の人は高収入になりやすい」のは間違い。

正しくは、「年齢が高い人ほど高血圧になりやすく、高収入になりやすい」ということであり、年齢が交絡因子

実際の論文を見てみよう

こちらの論文を使います。

出典:Aspirin Use and All-Cause Mortality Among Patients Being Evaluated for Known or Suspected Coronary Artery Disease A Propensity Analysis
Patricia A. Gum, et al. JAMA. 2001;286(10):1187-1194. doi:10.1001/jama.286.10.1187

簡単に研究の概要を書いておきます。

研究対象者:にアメリカのオハイオ州のクリーブランドクリニックで治療を受けた6174人の患者さん
研究期間:1990年から1998年、追跡期間の中央値は3.1年
研究目的:冠動脈疾患患者において、アスピリンは死亡率を減少させるのかを明らかにする

Youtubeで他の方も解説しています。
新谷歩の今日から使える医療統計学ビデオ講座: 交絡と回帰分析コンセプト

アスピリンの効果

この記事を読んでいるのは医療従事者を想定していますが、そうでない方向けにアスピリンの解説を少し書いておきます。看護師国家試験でも出る、かつ臨床でもよく使うので重要です。(学校の授業でやったと思いますが…)

アスピリンは熱を下げ、痛みを和らげる作用があります。また、低用量だと血小板の働きを抑えるので、脳梗塞や心筋梗塞の治療に使われます。薬としては、非ステロイド抗炎症薬(NSAIDS)の仲間に入り、バファリンやロキソニン、ボルタレンなどと一括りにされます。

バイアスピリンの薬剤添付文書 https://www.info.pmda.go.jp/go/pack/3399007H1021_1_19

結果について

Table.2の1行目を見てみましょう。

アスピリンを使用していない患者さんよりもアスピリン使用した患者さんのほうが死亡ハザードが108%に増えたが、統計的有意差はなかった。

という意味です。

※死亡ハザードは超短期的な死亡率を表すので、「死亡が108%になった」と読み替えて大丈夫です。(厳密に勉強することは今回目的としていません。)

これ、おかしいですよね?

アスピリンは冠動脈疾患を改善するはずなので、死亡ハザードは減少していなくてはいけません。

交絡因子はどこにあるのか?

どこがおかしいのか探るために、Table.1を見てみましょう。

この表はアスピリンを使用した患者さん達と使用していない患者さん達にどのような違いがあるかを述べた表です。

  • 上枠のage(年齢)を見てみると、アスピリンを使用した患者さん達のほうが高いです
  • 下枠の冠動脈疾患に罹ったことがある人の数をみると、アスピリンを使用した患者さん達のほうが多いです

ということは、アスピリンを使っている患者さんのほうが、重症度が高いのでおかしな結果が出てしまっているのです。

このように結果を邪魔している集団の特徴が交絡因子なのです。

先程の3つの条件に当てはめると、年齢、性別、冠動脈疾患の既往などは交絡因子だということがわかります。

この交絡因子を調整しているのがTable.2の3行目なのです。

これは

年齢、性別、冠動脈疾患の既往で調整したところ、アスピリンを使用していない患者さんよりもアスピリン使用した患者さんのほうが死亡ハザードが57%に減少した。統計的有意差も認められた。

という意味です。図に起こすとこんな感じになります。

まとめ

  • 交絡因子とは、2つの集団のアウトカムを比較する際にあらわれる変数で、次の3つの条件を満たす。①アウトカムに影響を与える、②要因と関連がある、③要因とアウトカムの中間因子でない
  • 交絡因子のために、架空の因果関係が見えたり、研究の結果を邪魔したりといったケースがある

おすすめの教材

統計学や統計リテラシーについて学ぶことが、統計学初心者にとっては良いと思います。「統計学が最強の学問である」という本は、数式をできるだけ使わずに説明しているので、文系の方にもおすすめです。

レビュー記事はこちらです。

公衆衛生と統計学のつながりを学ぶならこれ

参考にしたサイト

いちばんやさしい、医療統計

交絡因子とは?中間因子など統計的な意味を事例でわかりやすく簡単に|いちばんやさしい、医療統計
統計とはデータが出てからしか使わないのでしょうか?いいえ、それよりももっと重要なことがあるのですよ。それを知ってくださいね。

新谷歩の今日から使える医療統計学ビデオ講座: 交絡と回帰分析コンセプト

一般社団法人日本疫学会 疫学用語の基礎知識

交絡バイアス 交絡因子 | 疫学用語の基礎知識

バイアスピリン錠100mg薬剤添付文書

403 Forbidden

この記事の内容は以上です。

コメント

タイトルとURLをコピーしました