不均質性と変数定義で見るデータ解析の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

不均質性は、変数に関連して用いられる用語で、集団の属性のばらつきが大きい場合、不均質とされ、ばらつきが少ない場合は均質とされる。研究では、概念と変数の定義が重要であり、概念は辞書的な定義ではなく、概念的および操作的に定義される。概念的定義は理論的意味を示し、操作的定義は研究で情報を収集するための手順を具体的に示す。不安や体重のような変数は操作的に定義され、質的・量的研究のアプローチに影響を与える。また、変数間の関係も重要で、喫煙と肺がんのように因果関係がある場合もあれば、温度のように機能的関係が存在する場合もある。研究では関係を検証するため、質的研究はパターンやテーマを探求し、量的研究は数値的データに基づいて関係を明らかにすることが求められる。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次不均質性と変数定義で見るデータ解析の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

不均質性

しばしば変数と関連づけて使用される用語に不均質性がある．

調査研究中の集団の属性がきわめて多様である場合には，その集団はその変数に関して不均質(heterogeneous)であるという．

他方，もしばらつきの量が小さいならば，その集団は相対的に均質(homogeneous)であるとみなされる．

たとえば,身長という変数に関しては,２歳の子どものほうが18歳の青年よりも均質である．

対象集団のぱらつきまたは不均質性(heterogeneity)の程度は，研究のデザインに重要な意味をもつ．

概念と変数の定義

研究における概念は，定義し詳細に説明しなくてはならない．辞書による定義が適切であることはほとんどない．

概念的定義と操作的定義の２種類の定義が，とくに研究とかかわっている．

前述したように，研究者が関心をもつ概念は観察可能な現象の抽象化である．

研究者の世界観および看護についての見解が決め手となって,それらの概念が定義づけられる．

概念的定義(conceptual definition)は，研究する概念についての抽象的な意味もしくは理論的な意味を示す．

概念の意味は，理論的な構築，適切な文献の正確な理解，または研究者の臨床経験（またはこれらの組み合わせ）などに基づいている．

単純にみえる用語であっても，研究者によって概念的に定義される必要がある．その古典的な例はケアリングという概念である．

モースら〔Morse et al 1990〕は，多くの看護研究者と理論家の業績を精査して，どのようにケアリングが定義されているかを調べた．

そして，その概念的定義には５種のカテゴリーがあることがわかった．

つまり，人の特性，倫理的要請，情愛，人の相互関係，治療的介入の５つである．

ケアリングにかかわる研究をする研究者は，どの概念的定義をとっているのかを，自らに対しても読者に対しても明らかにする必要がある．

質的研究では，重要な現象の概念的定義が，研究活動の主な最終的成果となろう．

というのも，研究活動は，研究されている人々が定義する概念の意味を把握することをめざすからである．

しかし，量的研究では研究者はその研究に着手する時点で，研究概念を明らかにし定義づける必要がある．

量的研究者は変数を実際の研究状況でどのように観察し測定するかを示さなくてはならないので，これが必要となる．

概念の操作的定義(operational definition)は，必要な情報を収集するために研究者が行わなければならない操作を特定している．

操作的定義は概念的定義に対応しなくてはならない．

操作が簡単にできるかどうかは，変数によって異なる．

たとえば，体重という変数は定義するのも測定するのも容易である．

体重は「対象となる物の重さをポンドで，またはもっとも近いポンド値で量った量」と操作的に定義できる．

この定義は，体重はグラムではなくポンドという度量法で測定するよう指定している点に注意しよう．

操作的定義では，研究対象者の体重は10時間の絶食ののち，完全に衣服を脱がせ，ばね秤を使用してもっとも近い範囲のポンドを読みとる，と特定することもあろう．

この操作的定義は，体重という変数の意味を明らかにするのである．

不幸にして，看護研究において関心がよせられる変数で，体重のように容易に操作できるものは少ししかない．

多くの変数を測定するには多様な方法があり，研究者は概念化するにあたって，もっとも変数をよくとらえる方法を選ばなければならない．

不安を例にとってみよう．これを生理的機能と心理的機能の両面から定義するとしよう．

研究者が不安の生理的側面を強調しようとするならば，操作的定義にはバルマー・スウェット・インデックス(Palmer Sweat Index)のような生理的測定を含むことになろう．

他方，もし不安を第一義的には心理状態であるとして概念化するならば，操作的定義には不安尺度(state anxiety scale)のような自記式測定尺度がもちいられるだろう，研究報告を読む人が，その調査研究者が変数を概念化し操作するやり方に対し必ずしも同意するとはかぎらない．

しかし用語を正確に定義すれば，ある研究の文脈のなかでその用語が意味することを正確に伝達できるという利点がある．

概念的定義と操作的定義の例

ベックとゲーブル〔Beck & Gable, 2001〕は，産後うつ病のさまざまな様相を概念的に定義し，ベックが開発した指標，産後うつ病検定尺度(postpartum depression screening scale: PDSS）に，その定義がどう操作的に関連するかを記述した．

たとえば，認知障害という産後うつ病の一局面は，「母親が自分の思考過程をコントロールできなくなることで，自分が正気を失うかもしれないという恐れを抱くようになる」と概念的に定義された．

操作的には，「頭の中を考えが駆けめぐるのを止められない」という説明に自分の状態があてはまる，と当人が指定すると，この女性がどの次元であるかをPDSSが把握するのである．

データ

調査研究のデータ(data,単数形はdatum)は，調査のあいだに得られた断片的な情報である．

量的研究においては，研究者は，関心のある変数を特定し，それらの変数の操作的定義づけを行い,対象から関連のあるデータを収集する．

研究の変数の実際の数値は，プロジェクトのためのデータを構成している．

量的研究者は主に量的データ(quantitative data),つまり数のかたちをとった情報を収集する．

たとえば，主な変数がうつ状態である量的研究を行うと仮定してみよう．

われわれは研究参加者がどの程度うつ状態であるかを測定する必要がある．

われわれは次のような質問をするだろう．

「先週のことをふりかえってみて，0から10の尺度で，うつ状態がどの程度であったと思われますか．0はまったくない”を意味し，10はもっとも高い”を意味します」.

質的研究においては，研究者は主に質的データ(qualitative data)つまりナラティブ（語り）の記述を収集する．

ナラティブの情報は，参加者との会話や自然な状況下で参加者がどのようにふるまうかについての詳細な記録を作成すること，または日記のような，参加者自身によるナラティブの記録を入手することで得られる．

うつ状態について質的研究を行うとしよう.

「最近あなたがどんなふうに感じているか，話していただけますか．たとえば，悲しいと感じているとか，いつも憂うつであるとか,概してよい精神状態であるとか」．

ここでのデータは，それぞれの参加者の情緒的状態についての豊かなナラティブの記述からなっている．

一般に，研究データを分析可能にするために，コーディング(coding ; コード化）という操作が必要である．

量的研究では，コーディングとは言語的データを数値に置きかえる過程である．

たとえば，対象の性別についての質問への回答を，女性は1”，男性は2”（またはその反対）とコード化する．

質的コーディングでは，研究者はデータ上の重要なテーマをあらわすコーディング・カテゴリーを開発する．

関係

記述的研究を除いて,研究者が単一の,孤立した概念や現象に興味をもつことはまれである．

記述的研究の一例として,静脈内注射(IV)での治療を受けており，IVの組織浸潤を経験した患者の割合を明らかにする研究を行うとしよう．

この例では，変数はIV組織浸潤ありと，IV組織浸潤なしである．

しかし，通常，研究者はある現象を他の現象との関係において研究する，

すなわち研究者は関係を探索または検証する．関係(relationship)とは，現象間の結びつきまたはつながりを指す．

たとえば,研究者は繰り返し，喫煙と肺がんのあいだに関係があるという結果を明らかにしている．

質的研究と量的研究はともに関係を検証するが，その方法は異なっている．

量的研究では，研究者は主に，独立変数と従属変数の関係に関心をもっている．

研究設問は，従属変数における変化が,独立変数における変化と，系統的に関係しているかどうかを問うものである．

関係はたいてい～以上，～以下などのように，量的用語であらわす．

例として，従属変数として体重を考えてみよう．

どのような変数が体重に関連しているだろうか．

身長，カロリー摂取，運動などがある．

これらの独立変数の各々について，従属変数との関係の性質を予測することができる．

身長：背の高い人は低い人よりも体重が重い．

カロリー摂取：カロリー摂取が高い人は，カロリー摂取が低い人よりも体重が重い．

運動：運動量が少なければ少ないほど体重は重くなる．

これらの各々の説明は,体重（従属変数）と測定可能な独立変数とのあいだに予測される関係を述べている．

…よりも多いとか…よりも重いという言葉は,一方の変数に変化が観察される場合,体重にもそれに対応する変化が観察できるであろうことを意味する．

もし，ネイトがトムよりも背が高いなら（他のどのような情報が不足していても），ネイトはトムよりも体重が重いと予測できる．

大部分の量的研究は，変数間に，関係があるか否かをみきわめるために行う．

量的研究は，関係についての次のような課題をあつかうことが多い．

・変数間に関係が存在するか（例：喫煙は肺がんに関係があるか）.

・変数間の関係の方向性はどうか（例：喫煙が多い者は喫煙が少ない者よりも肺がんにかかりやすいか，かかりにくいか）.

・変数間の関係はどの程度の強さか（例：喫煙と肺がんとの関係はどの程度強いか．喫煙者が肺がんの犠牲になる確率はどの程度か）.

・変数間の関係の性格はどのようなものか（例：喫煙が肺がんの原因か．なんらかの他の因子が喫煙と肺がんの両方の原因か）．

この最後の課題が示すように，量的変数は，さまざまな様式で互いに関係している可能性がある．

１つは因果関係(causc-and-effect relationship またはcausal relationship)である．

実証主義パラダイムでは，自然の現象は偶発的・偶然的なものではなく，すべての現象にはおそらく発見可能な先行因子もしくは原因があると仮定する．

たとえば，体重についての前述の例では，カロリー摂取と体重のあいだには因果関係がある，つまりカロリーを多く摂取するほど体重は増加するといえる．

因果関係についての研究例

ケラーとトレヴィーニョ〔Keller & Trevino, 2001〕は，メキシコ系アメリカ人女性を対象に，歩行療法（およびさまざまな歩行頻度）が肥満症や高脂血症などの心臓血管の危険因子を低減するかを研究した．

諸変数間の関係すべてが，因果関係として解釈できるわけではない．

たとえば，ある人の肺動脈の温度と中耳の温度とのあいだには，ある関係が存在している．

つまり，肺動脈の温度が高い大は，中耳の温度も高くなる傾向にある．

しかし，たとえ２つの変数が関係していたとしても，肺動脈の温度が中耳の温度の原因となったとはいえないし，中耳の温度が肺動脈の温度の原因となった，ともいえない．
この種の関係は，因果関係ではなく，むしろ機能的関係(functional relationship)〔または連合的関係(associative relationship)〕という．

機能的関係についての研究例

プレスラーとヘプワース〔Pressler & Hepworth, 2002〕は，早産新生児の行動能力と児の性別との関係，および人種との関係を検証した．

質的研究者は，関係を定量化することや，因果関係を検証したり確認することには関心をもたない．

むしろ，質的研究者は，関心ある現象の根底にある意味や広がりを解明する方法として，関連するパターンを探究する．

テーマやプロセスが相互に結びついているパターンは，全体を理解する１つの手段とみなされる．

質的研究では，現出するカテゴリー間の関係を明らかにすることによって，理論が生みだされることがある．

この新しい連関が，「データ分析ののち，ばらばらになっていたストーリー（物語）を再構成する」のに役立つ〔Glaser, 1978, p.72〕.

パターンについての質的研究例

ラムとマッケンジー〔Lam & Mackenzie, 2002〕は，ダウン症児を育てている中国人の両親の体験を探索した，徹底的な面接から現れた１つの主要なテーマは，親として子どもを受け入れることであった．

研究者は，母親と父親の相違をとくに検証しようとしたわけではないが，母親と父親では子どもを受け入れるペースが異なることを指摘した．

不均質性とは、しばしば変数に関連して使用される概念であり、調査研究の対象となる集団の属性に多様性が見られる場合に、その集団はその変数に関して不均質（heterogeneous）であるとされる。反対に、ばらつきの量が少ない場合、その集団は相対的に均質（homogeneous）であるとみなされる。たとえば、身長という変数に関しては、2歳の子どもの集団は18歳の青年の集団に比べて均質である。これは、年齢が若いほど集団内の個体間での身長のばらつきが少ないためである。このように、集団の不均質性の程度は研究デザインにおいて重要な要素となる。研究を設計する際、集団の不均質性を考慮しないと、結果が偏ったり不正確になったりする可能性があるためである。概念と変数の定義においても、研究における重要なステップの1つは、使用する概念を明確に定義し、詳細に説明することである。これは、研究結果を解釈する上で不可欠なプロセスである。辞書による定義が適切であることはほとんどなく、研究者は研究対象とする概念を独自に定義しなければならない。研究に関わる定義には、大きく分けて概念的定義と操作的定義の2つがある。概念的定義とは、研究者が関心を持つ概念についての抽象的な意味や理論的な意味を示すものである。概念的定義は、研究者の世界観や、その分野における過去の文献、理論的な枠組み、そして場合によっては研究者自身の臨床経験に基づいて作成されることが多い。単純に見える用語であっても、研究者がその意味を定義する必要があり、そのための概念的定義が行われることが多い。例えば、「ケアリング」という概念は、多くの看護研究において取り上げられているが、その定義は研究者によって異なる。モースら（Morse et al, 1990）は、看護理論家や研究者の業績を精査し、「ケアリング」がどのように定義されているかを調べた結果、5つの主要なカテゴリーが存在することを明らかにした。それは、人の特性、倫理的要請、情愛、相互関係、治療的介入の5つである。このように、どのような概念的定義を採用するかは、研究者自身の価値観や視点に大きく依存しており、その定義を明確にすることは研究の信頼性を高める重要な要素である。さらに、質的研究では、概念的定義が研究活動の最終的な成果の一つとなることが多い。なぜなら、質的研究では研究対象者がどのように概念を定義するか、つまり彼ら自身の意味づけを探求することが研究の目的となるからである。一方、量的研究では、研究の初期段階で概念が明確に定義される必要があり、それに基づいてデータ収集が行われる。量的研究では、研究者は変数を観察し、測定するために操作的定義を用いる。操作的定義とは、必要な情報を収集するために研究者が行う具体的な操作や手順を示すものである。操作的定義は、概念的定義に対応していなければならない。たとえば、体重という変数は、定義するのも測定するのも比較的容易である。体重は「対象となる物の重さを最も近いポンドまたはグラム単位で量った値」と定義できるが、これは明確に測定方法を指定している。一方で、不安のような心理的変数は、定義や測定がより複雑である。不安を生理的および心理的な機能として定義する場合、生理的な測定には汗の量を測定するパルマー・スウェット・インデックスなどが使用され、心理的な測定には不安尺度（state anxiety scale）のような自己報告式の尺度が用いられることがある。これにより、研究者は不安という変数を操作的に定義し、測定する方法を選択する。このように、操作的定義は、研究者がどのようにデータを収集し、それをどのように測定するかを明示するために不可欠である。看護研究においては、体重のように簡単に測定できる変数は少なく、多くの変数はより複雑な方法で測定される必要がある。変数を正確に定義することで、研究の文脈においてその変数が何を意味するのかを明確に伝えることができ、他の研究者がその結果を再現したり比較したりする際の基盤となる。ベックとゲーブル（Beck & Gable, 2001）の研究では、産後うつ病のさまざまな側面が概念的に定義され、その定義がベックの開発した産後うつ病検定尺度（PDSS）にどのように操作的に関連しているかが説明された。たとえば、「認知障害」という産後うつ病の一側面は「母親が自分の思考をコントロールできなくなり、自分が正気を失うかもしれないという恐れを抱く」という概念的定義があり、操作的には「頭の中を思考が駆け巡るのを止められない」という感覚に合致するかどうかを測定することで、検出される。このように、操作的定義は概念を具体的な測定方法に結びつける役割を果たす。データ収集においては、量的研究と質的研究のアプローチが異なる。量的研究では、研究者は関心のある変数を特定し、その変数の操作的定義を行い、対象集団から関連するデータを収集する。このデータは数値として表され、研究プロジェクトのデータを構成する。例えば、うつ病を対象とした量的研究では、研究者は参加者のうつ状態を0から10の尺度で評価するよう求め、その結果を数値化して分析する。これに対して、質的研究ではナラティブ（語り）を収集し、参加者の行動や言葉を詳細に記録する。質的研究のデータは、参加者が自身の感情や体験をどのように表現するかに焦点を当てており、その内容を分析して重要なテーマやパターンを見つけ出す。研究データを分析する際には、コーディング（データの分類と整理）という操作が必要であり、量的研究では言語データを数値に変換し、質的研究ではデータに含まれる重要なテーマを示すカテゴリーを開発する。関係性の研究においても、量的研究と質的研究ではアプローチが異なる。量的研究では、変数間の関係を明らかにしようとし、研究者は独立変数と従属変数の関係に焦点を当てる。たとえば、体重という従属変数があり、それに関連する独立変数として身長、カロリー摂取量、運動量などが挙げられる。研究者はこれらの変数間の関係を予測し、変数がどのように影響し合っているかを定量的に示す。一方、質的研究では、関係を数値化することよりも、現象の背後にある意味や文脈を理解することが重要視される。質的研究者は、参加者の語りや行動からテーマやパターンを抽出し、それらがどのように関連しているかを解明することで、全体像を理解しようとする。

関連記事

統計学におけるZ得点とは

インフォームド・コンセント(説明に基づく同意)

統計に関する誤り

ビッグデータの統計学

看護研究：過去、現在、そして未来

事業所数と地域分布

統計解析は昔は大変だった

統計学における測定についての理解の重要性

統計学における測定尺度

サービス業に関する統計

前へ

1

2

3

4

5

6

次へ

【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
【医療統計解析】

【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

Google Gemini・Python・エクセルを使った講義で最速マスター

不均質性と変数定義で見るデータ解析の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

不均質性と変数定義で見るデータ解析の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

不均質性

概念と変数の定義

概念的定義と操作的定義の例

データ

関係

因果関係についての研究例

機能的関係についての研究例

パターンについての質的研究例

サブメニュー

最新記事