各被験者に複数回測定した変数間の相関について

各被験者に複数回測定した変数間の相関について各被験者に複数回測定した変数間の相関について大阪大学大学院人間科学研究科○兼清道雄　狩野裕

発表構成～各被験者に複数回測定した変数間の相関について～発表構成～各被験者に複数回測定した変数間の相関について～ • 問題提起 • 線型混合モデルの適用 • 数値実験 • 線型混合モデルと構造方程式モデリング(Structural Equation Modeling: SEM)との比較

変数ごとに複数回測定 • ex.1) 「店内の清潔さ」と「価格への満足度」の関係をみたい • ☆お客さん一人ひとりに対して，一ヶ月間，来店ごとに「店内の清潔さ」と「価格への満足度」を評価してもらう • 変数ごとに複数回の測定 • 被験者（回答者）ごとに測定回数が異なる

変数ごとに複数回測定 • ex.2)新しい測定法の妥当性について検討したい • ☆今までの測定法は高価なため，1回のみ測定，新しい測定法については各被験者3回ずつ測定 • 変数ごとに複数回の測定 • 変数ごとに測定回数が異なる

従来法：平均値を用いて・・・ • ex.1) お店の例

問題点～平均値で相関係数算出～ • “相関係数の希薄化” • 複数回測定することにより，誤差分散が推定できる • しかしその誤差が取り除けないため相関係数の希薄化が生じる • “信頼性の違いを無視” • 特に,被験者ごとに測定回数が異なる場合，平均値の測定誤差の分布は被験者ごとに異なる • 測定誤差の分散をσ2とすると，3回測定の平均値の誤差分散はσ2 / 3，5回測定ならσ2 / 5，と異なる • しかし平均値の方法ではその点を考慮できない

線型混合モデルを用いれば興味ある相関を変量効果の相関としてモデル化が可能線型混合モデルを用いれば興味ある相関を変量効果の相関としてモデル化が可能 • 平均値を用いた方法 • “相関係数の希薄化”＆“信頼性の違いを無視”

線型混合モデル • general linear mixed model (Verbeke & Molenberghs ed. 松山・山口編訳 2001) • mixed-effects model (Littell et al. 1996) • 被験者iに対するモデル (Laird & Ware, 1982) • データの従属性を考慮した分析が可能 • 経時データ，階層データ，反復測定データなどを扱える

当該状況への線型混合モデルの適用 • Yijk：被験者iの変数jにおけるk回目の測定値 • 被験者i における変数j の真の値 • 変数間におけるこの真の値の相関を求めたい変数j の全体平均変数j に対する被験者i の個人差測定誤差

当該状況への線型混合モデルの適用 • 変数j’ について • 被験者i における変数j’ の真の値 下記のように構造を考えればρが求めたい相関となる

当該状況への線型混合モデルの適用 • それぞれの変数の測定誤差について • 変数ごとに異なった誤差分散を推定するように指定

SASプログラム • 測定値 y • 被験者 id • 二変数を識別する変数 cond PROC MIXED; CLASS id cond; MODEL y = cond /noint; RANDOM cond / SUB=id TYPE=UNR; REPEATED / SUB=id TYPE=VC GROUP=cond; RUN;

数値実験 • 目的 • 「線型混合モデル」と「平均値の方法」，どちらがより適切に相関係数を推定するかを検討する • 仮説 • 「線型混合モデル」は誤差分散の大きさや測定回数のアンバランスに関わらず適切な推定を行う • 「平均値の方法」は希薄化の影響を受ける • ただし，「線型混合モデル」は最尤法（制限付最尤法）を用いているため，データが少ない場合のパフォーマンスは怪しい

簡単な数値実験 • 変数ごとの測定回数を3回ずつとして，「線型混合モデル」と「平均値の方法」を比較した • 比較：平均二乗誤差の平方根 (RMSE) • RMSE：推定値のバイアスとバラツキ，双方を考慮した指標平均

結果：線型混合モデルの方が適切

従来法に対する理論的考察～相関の希薄化が強まる条件従来法に対する理論的考察～相関の希薄化が強まる条件 • 被験者ごとに測定回数がアンバランス

従来法に対する理論的考察～相関の希薄化が強まる条件従来法に対する理論的考察～相関の希薄化が強まる条件 • 変数ごとに測定回数がアンバランス

数値実験 • 条件 • 被験者ごとの測定回数のアンバランス具合（なし・小・大） • 変数ごとの測定回数のアンバランス具合（なし・小・大） • 被験者数（n=10, 30, 50） • 測定誤差の大きさ（大・中・小） • 3*3*3*3 = 81通りの組み合わせを想定（表1も参照のこと） • 各組み合わせごとに500データセット • 比較 • 平均二乗誤差の平方根 (RMSE) で比較 • RMSE：推定値のバイアスとバラツキ，双方を考慮した指標

結果：表2も参照

結果：測定回数のアンバランスに対して

まとめ • 各被験者に複数回測定した変数間の相関を考える場合 • 被験者数が十分であれば，問題点を含む従来法に比べ，線型混合モデルによる方法が適切であることが示された • ただし，希薄化の影響が無視できるほど，誤差が小さい，もしくは測定回数が多い場合は，従来法でも代替可能であることが示された

検証的因子分析のフレームワーク パス係数や測定誤差を指定することで可能多段抽出モデルのフレームワーク被験者を1次抽出，各測定を2次抽出とする各測定は多変量と考える Y11 Y21 Y12 Y22 F2 F1 Y23 Y13 Y24 Y14 S1 S2 … S30 Y11Y21 Y12Y22 Y13Y23 Y11Y21 … Y11Y21 Y12Y22 線型混合モデルとSEM

以下のデータに対し結果は不変であることが望ましい以下のデータに対し結果は不変であることが望ましい

ご清聴ありがとうございました

検定についての数値実験結果（α＝.05として）検定についての数値実験結果（α＝.05として）

各被験者に複数回測定した変数間の相関について

各被験者に複数回測定した変数間の相関について

Presentation Transcript