当月のインデックスへ戻る

昨日の日記

6月3日(水)

【思ったこと】
980603(水)[日記]5月の「日記猿人界」(3):登録日記のドメイン別の比較
 きょうは「日記猿人」登録日記についてドメイン別の頻度を算出してみた。手元ある日記フルリストの中でいちばん古いものは昨年の6月22日にセーブしたものである。これと本年の5/31時点での登録日記のドメインを比較してみたのが下の図である。

[Image]


 私はネット界のことはよく分からないのだが、確か「or.jp」や「ad.jp」のうちの大部分は、「ne.jp」に変更されることになっていたと思う。5/31の時点で「or.jp」は実数1498のうち659を占めている。この中に、いわゆる幽霊日記がかなりを占めている可能性があるが、あの変更期限はいつまでだったかなあ。
 なお、「or.jp」と「ne.jp」の比率は、上のグラフではほぼ2:1になっているが、先月5月の月間得票ランキングや、6/3朝の時点での手動更新報告による新作500のリストを見ると、「ne.jp」の比率が多くなっていることが分かる。これを下の図に示す(ピンクが「or.jp」、水色が「ne.jp」、黄色がその他)。

[Image]



 じつは、きょうの日記では、日記作者がよく利用するプロバイダを調べてみようと思っていた。基本的な作業としては、日記一覧フルリストからurl部分だけを切り出し、さらに個人部分の文字列を取り除き、ABC順にソートして、同じ文字列の出現頻度をカウントするという工程で簡単にチェックできると思ったのだが、同じプロバイダであっても「or.jp」と「ne.jp」が混在していたりして(「ne」に変更する際に他の文字列も変わっている場合がある)、機械的に頻度をチェックするのはかなり難しいことがわかった。たとえば同じ「dti」というプロバイダの場合でも、「dti.ne.jp」、「dti2.ne.jp」、「dtinet.or.jp」などいろいろある。「3web.ne.jp」と「threeweb.ad.jp」と「threewebnet.or.jp」は同じなんだろうか。このあたり、どなたか情報をお教えいただければ幸いである。
 いずれにせよファイルの加工はかなり進んでいるので、明日の日記で報告できると思う。
【ちょっと思ったこと】
【新しく知ったこと】
【リンク情報】
【生活記録】
【家族の出来事】
【スクラップブック(翌日朝まで、“ ”部分は原文そのまま。他は長谷川による要約。【 】部分は簡単なコメント。)】