統計学で見る正常値と異常値の境界【ChatGPT統計解析】
統計学では、正常値は一般的に「稀でないもの」とされ、平均値±2標準偏差の範囲内に収まるものを指します。これは正規分布の95.66%に当たり、それ以外は異常とみなされます。データが正規分布でない場合、5-95パーセンタイルを用いることもあります。しかし、「少数派は異常」という考え方は文化的な側面も含み、必ずしも科学的でないことがあります。また、検査項目が増えると異常とされる確率が高まるため、異常と判定される人が増えます。これには医学の進歩や検査の目的を再考する必要があります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計学における正常値と異常値
正常ということにはいろいろあるが、医療の世界で普通にいう「正常値」の多くは、単に「まれであることは正常でない」という考え方に基づいている。
平均値±2標準偏差
身長や体重、あるいは肝機能などを多数の集団で測定すると、平均値をピークとして両側に対称的に裾引く分布となる。
これが「正規分布」である。
検査データで山が左側(値が小さい側)に偏っている場合でも、対数変換(1、10、100、1000、を0、1、2、3、…などと読み替える)することにより、両側対称な正規分布に近づくので、その場合はそれを用いる。
そして正規分布の場合、分布全体の面積に対して、平均値±2標準偏差の範囲に95.66 %が入り、その外側に残るのは全体の5%弱となる。
そこで多数の集団で測定を行い、正常範囲の下限、上限を平均−2標準偏差、平均+2標準偏差とすると、この範囲から外れるのは20人に1人未満の少数派であるから、正常ではないとする。
多くの検査の正常値がこの方法で定められている。
5-95パーセンタイル
上と同じ考えでデータが正規分布にならないときは、分布の上位と下位の5%の位置にある数値(パーセンタイル)を用い、それをそれぞれ正常の上限と下限とする。
@にあわせて、合計5%になるよう、2.5パーセンタイルと97.5パーセンタイルでもよい。
いずれにしろ、まれなものは異常という考え方である。
文化的望ましさ
「少数派は異常」という考え方は、たとえば「足の指が6本あるのは異常」という発想につながる。
楽器など多くの道具が5本指を前提に作られ、手の指は5本ないと不便であるが、足の指が多くてもほとんど不便ですらない。
しかし多くの親は生まれてきた子どもの足の指が6本では嫌がる。
客観的合理的な理由がなくても、多くの人が違和感を持たないこと、受け入れること、が正常であり、時にそれは文化と表現される。
この考え方を推し進めると、多数派の意見に反対するものは、「頭がおかしい」、「精神に異常がある」として、病気扱いにされる。
そして、ここでいう多数派は、じつは多数派ですらなく、単に「権力」を持っているだけのことも、歴史上は多々あった。
多数派でも異常は異常!
一方正常を、人間の健康な生存にとって望ましい状態、という本来の医学上の意味に沿った定め方もあり、それもいくつかに分けることができる。
痛風という病気は、血液の中にある尿酸が多くなりすぎて析出し、関節に沈着することが原因である。
また、尿酸が腎臓に沈着すれば、腎障害になる。
通常尿酸は血液中の溶解度がおよそ10mg/100mlなので、それ以上になると析出し関節炎や腎障害になる。
そこでたとえ、血清尿酸濃度が10mg/100mlを超える人が集団の中に多かろうが少なかろうが、この値は異常である。
同様に、昔は血圧(収縮期)の正常値は年齢+ 90mmHgといわれたことがあったが、これは単に集団の年齢ごとの平均値の分布からきたことで、血管というホースの内圧である血圧が高すぎると、ホースを劣化させることは年齢にかかわりない。
そこで今は成人の血圧の正常値は、年齢を考慮しない一律の値を用いている。
確定診断や予後の推測力
検査は病気発見の道具であることに注目し、それがどのような値のときに、目的の病気が最も発見されやすいかということで異常値の範囲を決めることができる。
これはより具体的にはROC曲線という方法を用いる(4検査の有効性)。
この考え方は個々の病気の診断にとどまらず、予後の推測にも使うことができる。
かつて明治生命は保険契約者1237万人の体格とその後の死亡状況(生命保険支払い)を調査し、身長ごとの最低死亡率体重表を公表した。
この考え方はわれわれが正常値を知りたい本来の理由に一番近いのではないだろうか。
治療の効果と弊害
検査の直接の目的は診断であるが、より大きな目的は治療などの介入の要否を決めることである。
そこで逆に、その値を超えた場合治療を開始すべき値を正常範囲とする考え方がある。
そこでまず、治療法がない病気を診断するための検査は、検査を行う目的を十分考慮する必要がある。
また、そういう検査の結果を、「正常」、「異常」と判定することは、十分慎重でなければならない。
最近、特別な職業のため以外、あまり色覚検査は行われなくなったのは、その意味で妥当である。
同様に治療法がある場合も、その病気の害と治療に伴う合併症などの害とのバランスを考える必要があるし、そのバランスのレベルは医学の発展や医療技術の向上とともに変化するので、一定ではない。
正常値と統計のマジック
ここ数年、毎年1回は見る新聞記事に、「学会発表によると、人間ドック受診者のうち、異常なしであったのはわずかに14.5%」というものがある。
人間ドック関係の学会はいくつかあり、この報告もいくつかの学会からなされているわけであるが、そのどれもが「受診者の中で「異常なし」がいかに少なくなっているか」ということを強調しており、言外に「ストレス社会で病気や半病人が増えており、自分は大丈夫だと思っているあなたも、ドックを受ければ何か重大な異常が見つかるかも知れません。早く受けましょう」とドック受診を勧誘している文脈である。
そうであるなら、この記事にはいくつか疑問がある。
まず、異常者が増えているというが、異常かどうかの判定は同じ基準で行われているか、ということである。
医学の進歩と医療技術の高度化の中で、医療で用いる検査項目はどんどん増えている。
現在、法律(労働安全衛生法)で日本の全労働者6,000万人が毎年1回以上受けることを義務づけられた定期健康診断の11項目の検査は、1990年にほぼ現在の形になり、その後項目が徐々に増えてきたものであるが、それらは1990年以前は希望者が人問ドックで受けていた項目が多い。
こうした項目がドックではなく、職場で、かつ全員強制で受けるようになれば、ドックのほうはもっと検査項目を増やすとともに、高度な検査を行わざるをえない。
検査項目数が増えれば当然異常と判定される確率は増える。
ここで「検査項目数が増えれば当然異常と判定される確率は増える」ということを少し分析してみよう。
検査結果が数値で示される血液検査の場合、その正常値は平均±2標準偏差で決められることが多い。
これは「稀なことは異常とする」という考え方に基づく正常範囲であるから、偶然だけで異常にされることがある。
そうならない確率は、検査が1項目だけなら95%以上であるが、2項目ならそのどちらの検査でも異常にされない確率は、およそ0.95の2乗で90%と下がる。
これがさらに検査項目が増えていくとどうなるか。10項目検査すると0.95の10乗 = 0.599で約6割、20項目なら0.95の20乗=0.358で3割近くまで、異常でない人の割合が減る。
受診者の7人に1人しか全項目異常なしという状態は、0.953の38乗≒0.143≒1/7で、38項目検査すれば自動的に達成される。
法律で強制された定期検診項目でも、個々の検査項目(視力・聴力の左右それぞれを含め)を拾っていけば、結果が数値で表される検査だけでも17項目となるので、ドックでの全検査項目は38項目を超えている可能性は高い。
加えての疑問は、そもそもドックを受診するのは、健康上の異常を発見し、それを改善するためであるはずである。
ドック受診者には施設側からの勧誘もあり、リピーターが多いという。
本来受診者は発見された異常に対し何かしらの治療や指導が行われ、翌年には改善しているはずである。
それにもかかわらず、このように急速に異常者が増えているということは、ドックで異常を見つけることが本来の目的である健康改善に役立っていないのではないか、と考えさせられる。
また、項目自体が改善しないようなものなら、そもそもそういう検査をすることに意味があつたのかとも考えざるをえない。
新聞記事は、もっとドックを受診しようという勧誘のメッセージのように見えるが、以上のようによく考えてみると、統計のマジックによる誤ったメッセージと、ドックの限界を示す、むしろ逆向きのメッセージを発しているのではないかとも思われる。
関連リンク