ベストプラクティス

このページは、質的比較分析(QCA)の総合サイトCompasssのThe Best Practicesというページ(現在は掲載されていません)を、許可を得て翻訳したものです。これは、QCAの研究を行うにあたって習慣付けておくとよい考え方をリスト化したものです。翻訳にあたって、質的比較分析の特有の用語には、簡単な解説を付けました。翻訳の誤りの指摘などは、森大輔 までご連絡ください。

ベストプラクティス [日本語版]

ベストプラクティス(The Best Practices)は、Benoît RihouxとCharles C. Raginによって編集されたConfigurational Comparative Method (2008)から引用したものである。これらのベストプラクティスについてのさらなる情報については、この本を参照(それぞれの項目ごとに、本のページ数を付記した。それ以外の文中のページ数も、この本のものである。)

  1. 小規模・中規模データのリサーチデザインにおける事例選択
  2. 小規模・中規模データのリサーチデザインにおける条件選択
  3. 条件を意味ある仕方で2値化するには
  4. 真理表の質を評価するときにチェックすべきこと
  5. 矛盾する条件の組み合わせを解決するには
  6. 論理式の簡単化のために行うべき4つの手続き
  7. mvQCAでの閾値設定
  8. mvQCA特有の注意事項
  9. ファジィ集合のキャリブレーション特有の注意事項
  10. fsQCA特有の注意事項
  11. QCAの手続き全体を通じての技術的な決定や効果的な行動
  12. 透明性
  13. 言葉は大切である。正しい専門用語を使うこと!
  1. 小規模・中規模データのリサーチデザインにおける事例選択(case selection)(pp.20-25)
    • 全ての事例が、十分に共通した背景的特徴を持つものであるようにすること。
    • 「説明」しようとしている、複数の事例に共通する結果(outcome)を明確に定義しておくこと。
    • 一般的に言って、「ポジティブ」な結果の事例と「ネガティブ」な結果の事例の両方を含めるのがベストである。
    • 事例の母集団(あるいは標本)を「所与」のものと見なしてはならない。後になって事例を付け加えたり取り除いたりする可能性を残しておくこと。
    • 小規模・中規模データのリサーチデザインを行う場合: どれくらいの数の事例を扱えるか考える際には、それぞれの事例に対して十分精通できるか(経験的な「知識(intimacy)」を獲得できるか)どうか自分に問いかけること。
    • 大規模データのリサーチデザインを行う場合: 事例のタイプ(type)(種類もしくはカテゴリー)に対して十分精通すること。
  2. 小規模・中規模データのリサーチデザインにおける条件選択(condition selection)(pp.25-28)
    • 事例間で全く変動しないような条件を含めてはならない。言い換えれば、「変数は変動しなければならない」、そうでないならそれは定数になってしまう。
    • 条件の数は比較的少なめにすること。条件の数を多くすると、それぞれの事例を「個別化」してしまい、複数の事例に共通する規則性や結果の統一的な説明を見つけることが難しくなる。
    • 要するに、事例の数と条件の数のバランスをとらなければならない。理想的なバランスは数値で表すことはできず、たいていの場合試行錯誤によって見つけ出される。ただ、中規模データの分析(10個から40個程度の事例)では、4個から6、7個の条件を選択するのが一般的な慣行である。
    • それぞれの条件につき、結果とのつながりについて明確な仮説を定式化しておくこと。もし可能ならば、この仮説は必要条件や十分条件の形で定式化する。
  3. 条件を意味ある仕方で2値化するには(pp.39-44)
    • 閾値(threshold)を正当化する際には、常に透明性(transparency)を確保すること。
    • 実質的・理論的な根拠に基づいて閾値を正当化するのがベストである。
    • もしそれが不可能ならば、テクニカルな基準(例:数直線上での事例の分布を考える; p.79参照)を使う。最後の手段として、平均やメディアンなどといった、より機械的な区切り点(cutoff point)を用いることもできるが、それらが事例の分布を考えた際に道理にかなったものであるのかどうかをチェックすべきである。
    • とても似通った値の事例を分割してしまうような人工的な区切り点は避けること。
    • クラスター分析(p.130参照)のような、より精巧なテクニックを用いることもできるが、その場合にも、クラスターが理論的・経験的にどの程度道理にかなったものになっているかをチェックすべきである。
    • 条件を2値化するにあたってどのテクニックや理論を使用するにしても、条件を正しい「方向」にコーディングするように注意すること。すなわち、条件の存在(値が[1])がポジティブな結果(結果の値が[1])と関連することが理論的に予想されるように、コーディングすること。
  4. 真理表の質を評価するときにチェックすべきこと(pp.44-47)
    • 「ポジティブ」な結果の事例と「ネガティブ」な結果の事例の両方があることを、もう一度チェックする(ベストプラクティス1を参照)。
    • 直観に反するような条件の組み合わせ(configuration)がないことをチェックする。例えば、値が[0]の条件全てが[1]の結果を導いたり、値が[1]の条件全てが[0]の結果を導いたりするような条件の組み合わせである。
    • それぞれの条件が十分に異なるものになっているかどうかをチェックする。特に、全ての事例で複数の条件が全く同じ値を取ってしまうことがないようにすること。もしもそのような条件があるなら、それらの条件が互いに「似すぎていないか」自分に問いかけてみること(もし似すぎているなら、それらの条件は1つに統合できる)。
    • それぞれの条件が十分に変動しているかチェックする(一般的なルール:それぞれの値の少なくとも1/3は別の値になるように)(ベストプラクティス2の「変数は変動しなければならない」も参照)。

    もしこれらの条件のうちのひとつでも満たされないならば、事例・条件の選択や結果の定義・操作化の方法を再考すること。
    この段階で、それぞれの条件が結果にとって必要条件なのか十分条件なのかをチェックするのも有用である。

    基本的に8つの戦略がある。実際の研究では、これら全ての戦略を少なくとも考慮はしてみることが得策であり、これらのうちのいくつかを組み合わせたものが有用なこともしばしばある。

    1. 恐らく一番簡単な方法: 単にいくつかの条件をモデルに付け加える。モデルが複雑になるほど(すなわち条件が多くなるほど)矛盾が起こりにくくなる。なぜなら、付け加えられた条件が、事例の区別のための新たな情報源となりうるからである。もちろん、このような戦略は「盲目的な(hope-and-poke)」仕方でなされるべきではなく、慎重に理論的正当性を持って行われるべきである。モデルを複雑にしすぎないために、条件は1つずつ追加していくのが得策である。そうしなければ、限られた多様性(limited diversity) (p.27参照)というより大きな問題が生まれ、それぞれの事例の説明が「個別化」されてしまう。こうなるとcsQCAは、ある程度の簡潔性(parsimony)を達成するという目的(p.10参照)を実現できなくなってしまう。
    2. 1つ以上の条件を取り除き、別の条件に置き換える。
    3. モデルに含まれている条件の操作化の方法を再確認する。例えば、条件の2値化のための閾値が、2つの事例の間の矛盾の原因になっているかもしれない。閾値を調整することで、矛盾を解決できる可能性がある。もしくは、データの質の問題により矛盾が生まれているかもしれない。その場合、補足的なデータや改定されたデータを集める。これは最も骨の折れる選択肢だが、事例指向的な観点からはとても推奨される方法である。
    4. 結果の変数そのものを再考する。この戦略は見逃されがちである。結果を広く定義しすぎると、矛盾が起きるのは論理的に当然のことである。例えば、Rihoux (2001)において、探索的なcsQCAの分析をしている間に、最初に定義していた「ある政党の主要な組織的変化(organizational change)」という結果変数が、実は「組織的適応(organizational adaptation)」と「組織的過激化(organizational radicalization)」という、2つの相反するタイプに分けることが可能であることに執筆者は気がついた。組織的適応という結果のみに焦点を当てることで、執筆者は多くの矛盾する条件の組み合わせを解決することができた。
    5. それぞれの矛盾する条件の組み合わせを、より質的で「厚い(thick)」方法で再確認する。何が欠けているか?モデルにおいて、あるいは条件や結果を操作化する方法において、今まで考慮されていないもので、当該事例を区別できるものは何か?
    6. 全ての事例が本当に同じ母集団に属するのか(cf. 事例選択 p.20)を再考する。例えば、矛盾を作り出しているのが「境界(borderline)」事例であるなら、その事例は分析から除くべきであるかもしれない。
    7. 全ての矛盾する条件の組み合わせについて、結果の値を[0]に再コーディングする。この解決法は、Ragin (1987)で示唆されたものである。矛盾する条件の組み合わせは「はっきりしないもの(unclear)」として扱い、事例・結果間の関係の整合性を増すことと引き換えに、条件の組み合わせ簡単化をある程度までで諦めるという決定がここでは行われている。
    8. 結果の「方向を知る(orientate)」ために度数(頻度)を基準として使用する。例えば、9個の事例が矛盾する条件の組み合わせを含んでいるものとする。そのうち8個の事例が[1]の結果であり、1個の事例だけが[0]の結果ならば、「最も頻繁に通る経路」が勝つと考えることができるかもしれない。したがってこの場合、9個の事例全てで[1]の値を取っているものと見なすことになる。しかしながら、この確率論的な戦略は、「事例指向的な」観点からは問題のあるものであることに注意すること。

    もちろん、選択された戦略は、経験的な根拠(事例に基づく知識)や理論的な根拠によって正当化されなければならず、機会主義的な「操作(manipulation)」の結果であってはならない。

  5. 論理式の簡単化(minimization)のために行うべき4つの手続き(pp.59-65)
  6. 以下は、コンピュータソフトを使った簡単化の手続きのためのチェックリストである。

  7. mvQCAでの閾値設定(pp.76-78)
    • csQCAにおける2値化についてのベストプラクティス(ベストプラクティス3参照)は、mvQCAの場合にも当てはまる。
    • mvQCAにおいてもたいていの場合、条件を3つか4つの値程度に分ければ十分である。
    • 多値条件の数は抑えて、2値条件を主とするのがベストである。
  8. mvQCA特有の注意事項(pp.69-86)
  9. csQCAのベストプラクティス(ベストプラクティス3456)は全てmvQCAにも当てはまる。加えて、mvQCAに特有の次のような注意事項がある。

    • 経験的・理論的見地から正当化されるなら、2値条件を優先して使うこと。
    • 多値条件は、多カテゴリーの名義・順序・間隔データをより正確に表現するために使うことができる。
    • 必要ならば、多値条件の「献立表(à la carte)」([訳注] 多値条件のそれぞれの値が何を意味するかをまとめた表のこと)を含めること。可能ならば、値の数は少なく抑えること(例えば、3個のカテゴリーに分けるか4個のカテゴリーに分けるか迷っているなら、3個のカテゴリーを使うこと)。5個以上のカテゴリーにするのは避けること。
    • 閾値の意味を視覚的にチェックするには、Tosmanaというソフトの「閾値設定(thresholdsetter)」機能をより体系的に用いること。
  10. ファジィ集合キャリブレーション特有の注意事項(pp.89-94)
  11. csQCAの2値化(ベストプラクティス3を参照)やmvQCAの閾値設定(ベストプラクティス7を参照)と同様に、ファジィ集合キャリブレーション(calibration)も分析の鍵となる操作であり、慎重に行うべきである。いくつかのベストプラクティス(例: 閾値を正当化する際には透明性を確保し、実質的・理論的根拠によって正当化されなければならない)は、3つの操作(csQCAの2値化・mvQCAの閾値設定・fsQCAキャリブレーション)全てにおいて共通である。ここでは、ファジィ集合キャリブレーションに特有のベストプラクティスを記す。

    • 集合論の言葉を使って、慎重にターゲットのカテゴリーを特定・定義すること(例: 「発展途上国(less developed countries)」の集合や「より都市化の進んだ国(more urbanized countries)」の集合)。
    • 理論的・実質的知識に基づいて、完全帰属(full membership)(メンバーシップ度が1)と完全非帰属(full nonmembership)(メンバーシップ度が0)はどんな場合かを特定する。
    • 無関係な変動は切り捨てるようにする(例: 国民1人当たりGNPのように指標を使った変数についての、疑問の余地なくターゲットとなる集合(例えば発展途上国)に属する、あるいは疑問の余地なく全く属さないことが分かっているような国の間の変動。)
    • ターゲットとなる集合に属するか属さないかが最も曖昧なのはどんな場合か評価する(例: 「発展途上国」の集合に属するか属さないかの境界にあるような、国民1人当たりGNP)。この評価が分岐点(crossover point)(メンバーシップ度が0.5)を確立する基礎となる。
    • 指標を使った間隔尺度変数や比例尺度変数に基づいてメンバーシップ度を決める場合には、fs/QCAというソフトのcalibrate関数を使ってファジィ集合を作成する。それには、完全帰属(full membership)と完全非帰属(full nonmembership)と分岐点(crossover point)のそれぞれについて、閾値の値を特定できる必要がある(Ragin 2008を参照) 。
    • メンバーシップ度キャリブレーションをする際にどんな手続きを取るにしても、その結果得られた値を常に慎重に検討すること。実質的・理論的知識に基づき、事例レベルでメンバーシップ度が道理にかなったものであるようにすること。
  12. fsQCA特有の注意事項(pp.87-121)
    • メンバーシップ度キャリブレーションを行う際には、機械的な基準ではなく、理論的・実質的(経験的)知識を使うことが非常に重要である。すなわち、ファジィ集合メンバーシップ度の割り振りはデータに基づき、解釈的に行うものであり、理論的な知識と事例指向的な研究の双方が絡み合うものである。
    • 研究者は、完全帰属(full membership)(メンバーシップ度が1)と完全非帰属(full nonmembership) (メンバーシップ度が0)と分岐点(crossover point) (メンバーシップ度が0.5)を特定する、明確な理由付けを考えるべきである。
    • 間隔尺度・比例尺度データをファジィ集合に変換するには、fs/QCAというソフトに組み込まれたcalibrate関数を使用する(Ragin 2008を参照)。
    • 整合度(consistency score)を表示した真理表(p.113の表5.8やp.116の表5.9を参照)を調べる際には、低い整合度の結果しか出ない行があるかもしれないことを念頭に置いておく。それらは矛盾する条件の組み合わせとして扱い、矛盾を解決するための手続きを用いる(本の第3章や第4章、特にベストプラクティス5を参照)。
    • もし必要条件について明確に仮説が立ててあるならば、真理表の分析を行う前に必要条件の分析を行うこと。すなわち、必要条件について高い整合度の閾値を設定して、必要条件と思われる条件については真理表の分析から排除する(すなわち、そのような条件は必要条件として別個に扱う。)([訳注] 真理表の分析は、主に十分条件についてのものなので、必要条件については別個に扱う必要があるということである。)
    • 度数(頻度)の閾値を選択する際には、事例の総数だけでなく、質も考慮すること。ただ一般的に言えば、総数が多くなると、度数の閾値も高くなる。
    • 整合度の閾値を選択する際には、そのデータの性質の下で可能な限り1.0に近い閾値を選択すること。また、整合度の分布の切れ目を探すこと。0.75より低い閾値を使うのは避けること。
    • 分析をする際は、3つの解を導き出すこと。すなわち、「複雑な解(complex solutions)」(論理残余を使わない)、「簡潔な解(parsimonious solutions)」(論理残余をもっともらしさを評価せずに全て使う)、「中間的な解(intermediate solutions)」(もっともらしい論理残余のみ使う)の3つである。
  13. QCAの手続き全体を通じての技術的な決定や効果的な行動(pp.123-138)
  14. 以下のようにcsQCAの適用を再検討することによって、より横断的で技術的なベストプラクティスを見つけることができる(これらは、mvQCAfsQCAにも適用できる)。

    • それぞれの技術的な決定(事例選択、閾値設定、論理残余の算入など)において、常に自分の選択を正当化し、透明性を確保すること。
    • また、異なる技術的な決定の下で分析をやり直してみるという感度分析(sensitivity analysis)が有用であるかもしれない。
    • 研究の過程で、最初の技術的な決定を変えることを恐れてはならない。QCAの手法は、何度も繰り返してみることで効果を発揮する。
    • 多くの場合、いつでも当てはまるような単一の戦略はない。問題解決的な戦略を組み合わせて用いると、しばしば効果的である。
    • 論理残余(と単純化の仮定)は、機械的に適用されるべきではない。それらを算入することの理論的な含意を熟慮しなければならない(p.152も参照)。
    • 結果の値が[1]となる条件の組み合わせと[0]となる条件の組み合わせをそれぞれ簡単化する過程で、矛盾する単純化の仮定が出てきた場合には、それらを見つけ出して対処すること。
  15. 透明性(transparency) (pp.167-168)
  16. 透明性は、QCAの手法全てを通じたキャッチフレーズ(buzzword)である。短い出版形態(例: 学会発表論文や学術雑誌論文)であっても、以下の要素は何らかの形で提供すべきである。

    • 素データ(raw data)表
    • 全ての変数(条件と結果)の操作化(2値化、3値化、ファジィ集合キャリブレーションなど)
    • 使用したソフトウェア(Tosmanafs/QCAなど)。簡単化は手計算で行うべきではない。
    • 真理表
    • 必要条件の分析
    • 矛盾する条件の組み合わせの扱い(存在した場合のみ)
    • 最終的な(矛盾のない)モデルに到達するまでの主要な繰り返し
    • 論理残余の使用方法(適用した場合のみ)
    • 最簡形の式を、叙述的に説明するだけでなくて、フォーマルな表記法で完全に記しておくこと。もしも最簡形の式の形がたくさんありうる場合には、全てを記すべきである。あるいは少なくとも、ある特定の式を選んだことは十分に記述し、正当化しなければならない。
    • 手計算で因数分解する前と後の、最簡形の式(適用した場合のみ、ベストプラクティス6を参照)
    • 整合度被覆度の値
    • 最簡形の式の解釈(どの「経路」がより重要でそれはなぜか?といったこと)

    もっとも、短い出版形態では、これら全ての要素を収めるのに十分なスペースがないかもしれない。それでも経験から言えば、うまく統合すれば全て表示することが可能である(よい例として、Chan 2003; Hagan & Hansford-Bowles 2005; Kilburn 2004; Osa & Corduneanu-Huci 2003; Redding & Viterna 1999; Vanderborght & Yamasaki 2004)。 短い出版形態に載せきれない要素(例: 大きすぎる素データ表、いくつかの条件の閾値の質的な正当化、最簡形の式の長いリストなど)は、別の媒体(例: ウェブページ)に掲載することも可能である。

  17. 言葉は大切である。正しい専門用語を使うこと!(pp.181-184)
  18. レポートや出版物などを書くとき、以下の理由から、正しいQCAの専門用語を使うことはとても大切である。

    • 読者の混乱を避けるため。読者が主として他の手法やアプローチの下でトレーニングを受けてきていると思われる場合は、特にそうである。
    • QCAの手法は、特定の目標・仮定・因果関係の概念を伴った、特定のパラダイムを基礎としているということを強調するため(例: 「条件(conditions)」は「独立変数(independent variables)」ではない)。
    • 根拠のない批判をさけるため(例: 「最簡形の式」は、母集団からの標本によって統計的に推測されるような「一般的な傾向(general trend)」を表すものではない。)
    • 自分の論証を十分に理解してもらうため。

    もしもスペースが許すなら(例えば脚注などで)、自分が使っている主要なQCAの専門用語の短い定義を書いておくと有用である。また、アブストラクトで、自分が使う手法(csQCA, mvQCA, fsQCAなど)をはっきりと述べておくべきである。

参考文献