240 likes | 366 Vues
尤度・尤度比・事前確率. 法数学勉強会 ( 京大法医学講座 ) 2012/02/18 京都大学 統計遺伝学 山田. 島の子ザル. 絶海の孤島 ボス ( 雄 ) ザルが倒れ序列が崩壊 N頭の雄ザル 1頭だけ、 『 血統書付き 』 1頭の雌 ザルから 1頭の子ザルが生まれた 父ザルは 『 血統書付き 』 か否か!. 島の子ザル. 雄ザルの DNA 『 血統書付き 』 の雄ザルの DNA はある それ 以外はマーカーの 『 頻度 』 だけ 事前確率 すべて の雄ザルが 1/N. 島の子ザル. 雄ザル S1,S2,...,SN S 1: 血統書付き
E N D
尤度・尤度比・事前確率 法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田
島の子ザル • 絶海の孤島 • ボス(雄)ザルが倒れ序列が崩壊 • N頭の雄ザル • 1頭だけ、『血統書付き』 • 1頭の雌ザルから1頭の子ザルが生まれた • 父ザルは『血統書付き』か否か!
島の子ザル • 雄ザルのDNA • 『血統書付き』の雄ザルのDNAはある • それ以外はマーカーの『頻度』だけ • 事前確率 • すべての雄ザルが1/N
島の子ザル • 雄ザル • S1,S2,...,SN • S 1:血統書付き • 尤度比 • p(1) : (N-1)p(2)
島の子ザル • 雄ザル • 個体別の尤度比 • p(1) : p(2) • 個体別の尤度比として、どれくらいの大きさで納得するか • 「取り違え事件」の1/N ?
島の子ザル • 実は • すべての雄ザルと雌ザルには「GPS」がつけられていて、「近くに居た時間」が計測されていた! • 近くに居た時間に比例して『事前確率』を変更しよう! GPS搭載のウミガメ
島の子ザル • 絶海の孤島 • ボス(雄)ザルが倒れ序列が崩壊 • N頭の雄ザル • 1頭だけ、『血統書付き』 • 1頭の雌ザルから1頭の子ザルが生まれた • 父ザルは『血統書付き』か否か!
日本列島の子 • 絶海の孤島 • N人の候補者 • 1人だけ、『お墨(戸籍)付き』 • 父親は『お墨付き』か否か!
日本列島の子 • 候補者のDNA • 『お墨付き』候補者のDNAはある • それ以外はマーカーの『頻度』だけ • 事前確率 • すべての候補者が 1/N ??? • N • ~5000万(半数) ? • ~4000万(成人男性) ?
日本列島の子 • 実は • すべての候補者と母親には「GPS」がつけられていて、「近くに居た時間」が計測されていた!!! • 近くに居た時間に比例して『事前確率』を変更しよう!
日本列島の子 • 候補者個体別の尤度比は計算できる • p(1) : p(2) • さすがに、GPS記録はないけれども・・・ • それに準じて、事前確率の重みはつけられるか・・・
GPS記録はないけれども・・・ • 事前確率 • 妊娠時期の見積もりずれが30-60日??として • N~30-60?? (単位は『日』) • N~30-60 x 24 (単位は『時間』) • N~30-60 x 24 x 60 (単位は『分』) • 『近くに居た時間』という重みづけは、もう少し、考えられそう • 事前確率「込み」での尤度比がL なら信用するのなら、 • Lは2体取り違えと大差ない・・・?
GPS記録はないけれども・・・ • N~30-60?? • 事前確率「込み」での尤度比がL なら信用するのなら、 • Lは2体取り違えと大差ない・・・? • 要求される候補者個体別の尤度比 p(1) / p(2) は • p(1) / (p(2)xN) = L • p(1) / p(2) = NxL
次回?マルチプルテスティング問題 • ペテン師団が • 手を変え品を変えて、100人を候補者として順繰りに送り込んできて、100人目で「当たった」とする
次回?マルチプルテスティング問題 • カタログと照合するときのこと • それらしいカタログ、それらしくないカタログ • 事前確率の高いカタログ、そうでもないカタログ • そのときの尤度・尤度比の評価 • カタログの大きさ(母集団に占めるカタログ上サンプルの比率)の影響・・・
肉親を求めて • 記憶喪失で発見された。天涯孤独? • いとこはいそうだ
肉親を求めて • 事前確率は 1/N : Nは人口? • 可能性のあるジェノタイプは K 種類、それぞれの確率はpi, i=1,2,...,K • 世界でそれぞれのジェノタイプの頻度はqi • 尤度が pi の人が Nxqi人
肉親を求めて • ペテン師が登場 • 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 • その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 • その100人のジェノタイプが、一般集団に占める割合を ti, i=1,2,...,100 • ペテン師のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える?
肉親を求めて • H1 • ペテン師のリストに本当のいとこが含まれている • H2 • ペテン師のリストに本当のいとこが含まれていない
肉親を求めて • H1 • ペテン師のリストに本当のいとこが含まれている • 100人のうち1人が「本物」で、残りの99人を「偽物」とした上で、すべての場合について、生起確率を計算して合算する • L1 = ΣiriΠj != itj • H2 • ペテン師のリストに本当のいとこが含まれていない • 100人のうち全員の100人を「偽物」とし、N-100人の中の1人がいとこである、生起確率を計算して合算する • L2 = Πj tj • L1/L2 = Σiri/ ti
肉親を求めて • 『親切な人』が登場 • 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 • その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 • 『親切な人』のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? • 『ペテン師』と『親切な人』の差は • リストに含まれている、と信じる「事前確率」が異なること • ペテン師の場合、100/N • 親切な人の場合、 >100/N • 『親切』な程度の『根拠』に応じて事前確率を上げる