人生を謳歌するブログ

正しい偏差値の求め方とその意味を解説します。

「偏差値」という言葉を使ったことはありますか?
「使ったことがない」という人のほうが少ないですよね。

では、「偏差値」というものの求め方や意味はちゃんと理解していますか?

求め方や意味もちゃんと理解していないのに、なんとなく偏差値で人の優劣を判断したり、「あの大学は偏差値が〇〇くらいだ」、「あいつは偏差値いくらの学校出だから」などと下世話な話ばかりする大人にはなりたくないですよね。

では、「偏差値」が何なのかと言うと、統計学的な用語のひとつです。

「統計学」と聞くと難しいイメージがあるかもしれませんが、偏差値なら式に含まれる指標の意味を一つひとつ理解するようにすればまったく難しくはありません。

その求め方は、「個々の得点から平均点を引いたもの」(これを偏差と呼びます)を「標準偏差」で割り、それに10を掛け、さらに50を加えたもの、これが偏差値です。

この説明を聞いても今一つ理解しづらいかと思います。

ですから、ここから先では「標準偏差」など偏差値を求めるために必要な数字の説明をし、「偏差値」とは何かについて考えていきます。

データは散らばる?標準偏差について

標準偏差とは、データの散らばり具合(散布度)を表す指標です。

たとえば、Aさん、Bさん、Cさんの3名からなる集団に対して行った国語のテストの得点が、Aさん5点、Bさん25点、Cさん60点だったとしましょう。

この場合の平均点は、90を3で割って30点ですよね。

次に同じ3名に対して英語のテストを行ってみたら、得点はそれぞれ20点、30点、40点になりました。

すると、英語の平均点も同じように30点です。

平均点という指標で見れば、双方ともまったく同じなわけです。

しかし、それぞれの得点の分布を見てみると、英語は平均点近くに3人とも集まっていますが、国語の場合はKさんをのぞいた2人の得点は平均点から離れたところに散らばっています。

このような散らばり具合を表す指標の一つが「標準偏差」なのです。

標準偏差を求める

標準偏差を求めるには、まず「分散」という指標を求めなければなりません。

分散は、「偏差(個々の得点から平均点を引いたもの)の二乗を合計し、それをデータの数で割って平均を出したもの」になります。

なぜ、二乗などという面倒なことをすると思いますか?

それは偏差を合計すると、どんなデータの集まりであっても必ず0になってしまうからです。

このため二乗したものを合計したうえで、その平均をとった分散という指標が用いられているのです。

ただし、分散は二乗という手続きをとるため、単位がもとのデータとは異なってしまっています。

そこで、分散の平方根を算出し、もとの単位に戻したものが標準偏差です。

つまり、「偏差の二乗の合計を、データの数で割った平均」の「平方根」が標準偏差ということになります。

ちなみに、例にあげた先ほどのテストの場合なら、国語の標準偏差はおよそ22.7(分散はおよそ516.7)であるのに対して、英語の標準偏差はおよそ8.16(分散はおよそ66.7)です。

要するに、テストの平均点から標準偏差の分だけ前後してテストの点数が分布していることを示しています。

このように、平均は等しくても、データの散らばり具合という指標で見れば、両者は大きく異なっていることが分かります。

一般的には分散や標準偏差が多く用いられているのは、相関係数など他の統計指標との関係で重要な役割を果たしていることに加え、統計的に便利な性質も備えているためです。

偏差値は標準化された得点

例えば、70点という同じ得点でも、平均点が50点のテストの70点と平均点が90点のテストの70点では意味が変わってきます。

また、データの散らばり具合が、先ほどの国語のテストのようにバラバラに散らばっているケースと、英語のテストのように平均点付近にまとまっているケースとでは、同じ得点であっても、その意味合いが異なります。

こういう場合に、偏差(個々の得点から平均点を引いたもの)を標準偏差で割れば、標準偏差を一つの単位として、得点が平均点からどれくらい離れているかという指標を得ることができます。

この指標はz得点と呼ばれるもので、その平均は0、標準偏差は1となります。

z得点を用いることによって、平均や散らばり具合の異なるテストの得点を比べることができるようになるのです。

標準得点と偏差値

z得点の求め方を見て、何かを思い出しませんか?

偏差値の求め方は、「偏差」(個々の得点から平均点を引いたもの)を「標準偏差」で割り、それに10を掛け、さらに50を加えたものでした。

そうです。z得点を10倍し、さらに50点を加えたものが偏差値なのです。

こうすることで偏差値の平均は50、標準偏差は10となります。

なお、このように、特定の平均と標準偏差になるよう変換を行う手続きは「標準化」と呼ばれ、標準化によって得られた値は「標準得点」と呼ばれます。

つまり、z得点や偏差値は、標準得点の一種なのです。ここまでが偏差値の「求め方」となります。
では、偏差値の「意味」とは何なのでしょうか。

偏差値をはかる正規分布とは

正規分布とは、左右対称の釣鐘型をした確率分布のことをいいます。

実はデータ数を多く集めれば集めるほど、その分布はこの正規分布に限りなく近づいていくことが分かっており、これを「中心極限定理」と呼びます。

そして、正規分布には平均より±1標準偏差以内には全データのうち約68.3%、±2標準偏差位以内には約95.4%、±3標準偏差位以内には99.7%のデータが含まれるという性質があります。

偏差値から見えてくるもの

偏差値は、平均が50、標準偏差が10になるように標準化した指標です。

これを先ほど説明した正規分布の性質にあてはめると、偏差値が40から60の間に全データのうち約68.3%が含まれ、そして30から70の間に約95.4%が、20から80の間に約99.7%が含まれるということになるわけです。

ですから、偏差値が70なら上位から約2.3%に位置するということが分かってくるわけです。

つまり、偏差値を求めれば、獲得した得点の全体的な位置づけがわかり、それによって平均やデータの散らばり具合が異なる得点同士を全体での位置づけという視点から比較することができるようになるのです。

これが偏差値の「意味」です。

ただし、「中心極限定理」について説明したように、分布の形状が正規分布に近づいていくのは「データ数が多い場合」です。

ですから、データ数が少ない場合には、偏差値を求めてもあまり統計学的に価値がないということになります。

最後に

ここまで見てきたように、偏差値とは集団内における得点の全体的な位置づけを知ったり、平均や偏差の異なる得点を比較するための統計的な道具です。

つまり、世間でいわれている偏差値というのも、実際は限られた科目の、しかも限られた回数しか行われていないテスト得点の全体的な位置づけを表した統計的指標にすぎません。

人柄や人間力、あるいはテストで測ることのできない能力や魅力などといったものは全く反映されません。

また、すばらしい学歴や社会的地位にあったり、いくらお金を持っていたりしても、それだけでは決して幸せになれないように、いくら偏差値が高くても幸せになれるかどうかとは関係がありません。

逆にいえば、いくら偏差値が低くても、あなたが幸せになれる可能性はまったく減らないということです。

あくまでも偏差値はただの指標であり、それ以上でも以下でもありません。

ましてや個人の何かを決定づけるものでは決してありません。ただ、それに何かしらの意味づけをしてしまっているのが我々なのです。

繰り返しになりますが、偏差値はただの統計的な道具です。
道具は「使う」ものです。

ですから、偏差値やそれに基づいた学歴で人を判断するということは、道具に「使われて」いる状態であり、非常に恥ずかしいことで無意味と言えるかもしれません。

道具は「使い方」を正しく理解してこそ力を発揮するのであって、理解しないまま使ってしまえば、逆に「使われる」ことになるのを覚えておくべきです。