読書的な何か。

読書と読書にまつわるテクノロジー、雑記など。

先人たちの読書論(1)

読書に関する本って本当にたくさんありますよね。ちょっとAmazonで検索してみても、「読書論」900件、「読書法」3000件、「読書」1万件以上がヒットしました。これだけ、本の読み方や活用法に対する需要があるということなのだと思います。

こういう需要は、昔の人にも当てはまっていたのではないかと思い、青空文庫を使って調べてみました。「読書」で青空内の検索をかけたら、いやぁ、ありますあります。1ページあたり20件の検索結果が10ページ以上続いています。重複やノイズを差し引いてもそれなりにボリュームがありそうです

1件ずつ読んで、その紹介をしてもよかったのかもしれませんが、あまりにも効率が悪いし、そもそも昔の文体はとても読みづらく、心が折れそうになります。そこで、手っ取り早く先人たちの読書に対する考えの傾向を掴もうと、テキストマイニングしてみることにしました。

以下、試したことをまとめてみます。

 【制約】

  • 青空文庫内を「読書」で検索し、最初の3ページ(60件)から図書カードのみ抜粋しました(抜粋基準として、出版年が不明なものは除外しています)。

【前処理】

  • テキスト内冒頭の用例、文末の制作情報、青空特有の文字(#、傍点)は削除しました。
  • 各図書カードは処理用にまとめて1ファイルとしています。

【データ内訳】

  • 対象は1869年~1953年の37文献になりました。
  • 以下に、対象の図書カードの一覧を示します。

1800年代 1件

1900年代 2件

1910年代 3件

1920年代 5件

1930年代 13件

1940年代 10件

1950年代 3件

【解析】

さて、やっと解析に入っていきますが、長くなってきたので、解析以降の模様は次にアップします。

リンク