じぶん更新日記

1997年5月6日開設
Copyright(C)長谷川芳典

4月のインデックスへ戻る
最新版へ戻る

[今日の写真] ムラサキハナナ(紫花菜)。花大根、あるいはオオアラセイトウなどとも呼ばれる。菜の花などの黄色が目立つ季節にあって、そのコントラストから逆に目立っている。各地で雑草化しているものの思ったほどには繁殖していない。肥沃な土地でないと育ちにくいためだろうか。


4月1日(金)

【ちょっと思ったこと】

新年度初日はバーチャル研究室で

 4月1日は、旅行先でネットに常時接続しながら紀要執筆に取り組んだ。近頃はペーパーレス化が進み、事務的な連絡の大部分はEメイルで送られてくるようになっている。私の場合、大学アドレス宛のEメイルはすべてYahooアドレスに転送して読んでいるため、研究室内で仕事をしている時と何ら変わらずに返事を出すことができた。学内限定の利用(図書館電子ジャーナル類の閲覧、各種事務的処理、公用サイト用のファイル転送など)ができないことを除けば、研究室のネット接続環境と何ら変わらない。

 ちなみに、大学アドレス宛には毎日150通ほどのEメイルが送られてくるが、実際に必要なメイルは20通前後で、残りはSPAMや、Virus Alert(大学センターからのウィルス除去通告メイル)ばかりである。YahooのSpam Guardで自動消去できるのは、全体の1/4から1/3程度に留まっているが、それでも有り難い機能である。

【思ったこと】
_50401(金)[教育]順番に並べることの意味と『平均順位』

 物事を何かの基準でランク付けして、優劣を競うということがもてはやされる傾向がある。昨日の日記で取りあげた「高校別 東大合格者数」ランキングもその1つであるし、同じ日にこちらからリンクした、日記才人の月間得票ランキングもその1つ。また、音楽の紹介ではヒットチャートが当たり前のように取り入れられている。

 ところで、この順位、あるいは順番の統計学的な意味については種々の誤解や理解不足があるようだ。私自身も勘違いしていたことがあり、今なお分からない点も多い。

 そのうちの1つが「平均順位」である。そもそも平均値(算術平均値)とは,測定対象が間隔尺度以上である場合に限って意味がある代表値である。したがって、順序だけに意味がある場合、つまり、ゴムひもに目盛りをつけて伸ばしたり縮めたりしても性質が変わらないようなデータは、算術平均をとっても意味が無いのである。

 しかし、そういうデータにつけられる順位あるいは順番は、順序尺度以上の意味をもつ場合がある。

 例えば、データの個数が分かっており、かつそれが正規分布や二項分布というように何らかの分布となることが知られている場合には、順位を知るだけで偏差値を求めることができる。

 テーマパークの人気アトラクションの行列に並ぶ場合、自分が先頭から何番目かということには、間隔尺度もしくは比例尺度的な意味がある。1回の入れ替え数が分かれば、待ち時間の推定もできる。順番に比例して待ち時間が長くなるというなら比例尺度であると言ってもよい。

 毎日、入場開始の30分前に行列に並んだ時の「平均順位」というのは意味のある代表値であろう。なぜなら、それは、「行列の人数」と同じ意味をもつからである。

 年に複数回受けた模擬試験の平均順位というのは意味があるだろうか。もし、ほぼ同規模同レベルの受験者が受けていた場合は、志望校内の平均順位を知ることでより正確な合格可能性を推定することができるだろう。もっとも、上にも述べたように、その場合の順位は、偏差値とほぼ同義になる。いっぽう、規模やレベルの異なる模試の順位は、平均しても全く意味が無い。

 以上、まとまりのない内容になってしまったが、順位や順番には、順序尺度以上の意味がある。但し、それが間隔尺度あるいは比例尺度として扱えるかどうかは、順位の変動がどれだけ実質的な意味をもつかに依存しているように思う。行列の順番は、自分より前に並んでいる人の数と同義なので非常に意味がある。大学評価などでは、絶対評価のほうに意味があるのであって、大学ランキングの順位の変動に一喜一憂しても意味がない。「高校別 東大合格者数」も、ランキング順位よりも、合格者の絶対数あるいは進学率のほうに意味があると言える。