この記事は,Stan Advent Calendar 2020およびベイズ塾Advent Calendar 2020の23日目の記事です。この記事では,認知心理学で有名かつ頑健な現象の1つであるフランカー干渉を例に,drift diffusion model (DDM) の解説を行うシリーズの第1弾です。数理的な説明というよりは,実践上知っておいたほうが良いと思われる点を解説するつもりです。
※2022/7/16追記:DDMについては,以前「基礎心理学研究」に寄稿したチュートリアル論文でもより詳しく解説しているので,そちらもご参照ください。
本当はこの記事にもっといろいろな情報を盛り込みたかったのですが,最初の説明だけでそれなりの分量になってしまったので分割することにしました。第1弾である本記事ではDDMを直観的に理解するための解説を行います (同様の解説記事は既にいろいろありますが,僕なりの視点で解説します)。第2弾ではランダムウォークからWiener過程を作る方法について,第3弾ではDDMのパラメータの単位やスケーリングの影響について,第4弾ではStanでDDMを実装する方法と注意点について解説する予定です。
ちなみに,DDMについては過去にややマニアックな記事を2本書いていますが (「Drift Diffusion Modelのパラメータから選択確率を計算する関数:RとStanによる実装」,「StanでWiener分布からの乱数を得る方法(+累積分布関数ほか)」),このシリーズは過去の記事とは独立に読めるようにしています。
1. フランカー干渉の説明
このシリーズではフランカー干渉を例に挙げてDDMの説明をしたいので,まずはフランカー干渉の説明から。フランカー課題と呼ばれる実験課題にはいくつかのバリエーションがありますが,この記事では分かりやすさのために,矢印刺激を用いる課題を取り上げます。この課題の各試行では,図1のように左右どちらかを向いた矢印が複数提示されます。実験参加者の課題は中央にある矢印 (標的) が左右どちらを向いているのかをキー押しで回答することです。周辺にある矢印は無視すべき妨害刺激 (フランカー) ですが,フランカーの矢印の向きが標的と逆向きの場合 (不一致条件) には,同じ向きの場合 (一致条件) よりも反応時間が長くなり,誤答も増えるのが一般的です。このような現象をフランカー干渉と呼びます。

図1. フランカー課題の説明。
この記事の文脈において重要なのは,(1) 実験参加者は提示された刺激を見て「左」か「右」かを回答するということと,(2) 条件の組み合わせは標的の向きが2通り,フランカーの向きが2通りの計4通りであることです。フランカーと標的の向きが一致しているか否かに基づいて分類すれば一致/不一致の2通りとなるので一致・不一致それぞれの平均反応時間と正答率を求めれば良さそうにも見えますが,統計モデリングの文脈では横着せずにまずは丁寧に全ての条件の組み合わせを考えたほうが間違いが起こりにくいです。今回の場合,参加者の反応のレパートリーは「左」「右」の2通りであって,「正解」「不正解」を参加者が選択する訳ではない (正解/不正解は参加者の反応の結果によって決まる) ので,一致/不一致でまとめて正解/不正解を2値化してモデリングしようとするとおかしなことになりかねません (一致/不一致で分けてモデル化しても結果として4通りの組み合わせを考えたモデルと等価になる場合はありますが,今回のDDMの例ではそうなりません)。
2. DDMを直観的に理解する
それではDDMの直観的な説明をします。DDMはよく次のような図で説明されます。

図2. DDMの説明。
この図は,ある条件 (例えば,標的が「右」かつフランカーが「左」) において実験参加者が反応のために証拠を集積する過程を表しています。横軸は刺激が提示されてからの経過時間を表します。縦軸は,提示された刺激に対して参加者が「右」と反応すべきか,あるいは「左」と反応すべきかを判断するための証拠の量を表しています。今回の例では,縦軸の数値が大きいほど「右」と反応するのに十分な証拠,数値が0に近いほど「左」と反応するのに十分な証拠があると考えてください。
この例において,刺激が提示された時点では証拠の量の初期値zは真ん中の値 (灰色の破線) よりも若干高い値ですが,これは,この参加者が始めから「右」と答えやすいバイアスを持っていることを表しています。
刺激提示から少しの間は証拠の量に変化はなく,一定です。この変化がない期間は非決定時間と呼ばれ,刺激の符号化や反応のための運動 (e.g., キー押し) といった,左右の判断とは無関係な処理に要する時間を表します。この時間の長さをτと表します。図では非決定時間は刺激提示の直後に描かれているのに,判断が終わった後に行われるはずのキー押しの時間が非決定時間に含まれるということに違和感を覚える方もいるかもしれませんが,実は非決定時間はどの位置にあっても数学的には全く同じです。例えば刺激提示直後と反応の直前の2か所に2つの非決定時間が別々に存在すると考えても問題ありません (その場合,両者の和がτで表されます;その内訳は通常は識別不可能です)。説明の便宜のために,ここでは刺激提示直後のみに非決定時間が挿入されると考えることにします。
非決定時間が過ぎると証拠の集積が始まります。図に描かれている4本のうねうねは各試行に対応しています (1試行あたり1うねうね)。図では証拠の量がとても荒ぶっていますが,このうねうねを生み出すのがDDMの肝であるWiener過程です (次回の第2弾でもう少し詳しく説明します)。この例では証拠の量が見かけ上不規則に変動しているように見えますが,平均的にはだんだん値が大きくなる傾向があるように作っています。この平均的な傾向すなわち傾きをドリフト率と呼び,δで表します。今回の例ではδが正なので,うねうねしながらも「右」と反応する方向に証拠が集まりやすい傾向があることが分かります。逆に,δが負であれば「左」と反応しやすくなります。つまり,ドリフト率δは証拠の集積の速さ (絶対値の大きさ) と方向 (符号) を表すパラメータとして解釈できます。
実験参加者は証拠を蓄積するだけではなくて,蓄積された証拠に基づいて最終的に左か右のキーを押さなければなりません。そこで,証拠の量がある閾値に達したときに反応が生成されることを仮定し,証拠の量がα以上になったら「右」,0以下になったら「左」と反応すると考えます。下側は0で固定なので,上側のαだけを決めれば閾値が確定します。αの値が小さければ証拠の量が不十分でも反応が起こり,逆にαの値が大きければ十分な証拠が集まるまで反応が起こらないことを意味するので,心理学的にはαは慎重さを表すパラメータとして解釈することができます。なお,先ほど説明した初期値zに関しては,下側の閾値 (0) と上側の閾値 (α) の間の相対的な位置として表現したほうが解釈をする上で便利なので,(0,1)の範囲をとるパラメータβを使ってz = αβと表します。β = .5のとき反応バイアスなし,β > .5のとき上側 (この場合は「右」反応) へのバイアスあり,β < .5のとき下側 (この場合は「左」反応) へのバイアスありと解釈できます。
このようなプロセスに基づいて反応が生成されると仮定すると,反応時間は図2の上側と下側に描かれているような確率分布に従います。上側は「右」と反応したときの反応時間分布,下側は「左」と反応した時の反応時間分布で,これら2つの分布の面積の和は1となります。もし正答が「右」であったなら,上側の確率分布の面積は正答率を,下側の確率分布の面積は誤答率を表します。このようにして,選択された反応 (「左」か「右」か) と反応時間の同時分布を表現できるのがDDMのいいところです。ちなみに,この同時分布 (図2の上側と下側に描かれている2つの分布の組) はWiener過程にちなんでWiener分布と呼ばれます。このモデルはWiener過程が最初に閾値に達するときの時間の分布を表すのでWiener First Passage Time分布と呼ぶ方がより正確かもしれません (Stan Functions Referenceではそう表記されています)。
この記事は以上です。次回はWiener過程についてもっと詳しく説明します。