読書的な何か。

読書と読書にまつわるテクノロジー、雑記など。

読書術本の読書術を解析する(1)

2015年も残すところ3か月を切っておりますが、とある書店でブルータスの読書特集を見つけました。

マガジンハウス著「BRUTUS (ブルータス) 2015年 1/15号 [雑誌]」(マガジンハウス)
B0082TCM3E

著名人による読書の楽しみ方、書店員による2015年の課題図書など盛りだくさんの内容なのですが、一番気になったのは、ライター速水健朗氏による「読書術本の読書術」というレポート。修辞的にフクザツ感を醸し出していますが、まさに最近私がハマっていた「読書術」分野を俯瞰した記事になっていました。

速水さんによれば、読書術に関する本は、横軸にノウハウ⇔教養、縦軸に乱読⇔精読とする4象限にマトリクス化できるとのこと。そして、各象限に代表的な読書術本をプロットしていき、その解説を加えています。

本当に簡単にまとめると、以下のようになります。

  1. 教養:知識は古典の名著にあり
  2. ノウハウ:とにかく即戦力・実用
  3. 乱読:リベラルアーツ(一般的な教養)を得るためにとにかくたくさん読む
  4. 精読:一冊の本をいかに深く読み解くか

なるほどなぁと眺めていたのですが、これをなるべく客観的に計算したら、どんなマトリクス(あるいはマップ)になるんだろうか、という疑問がわいてきました。例によって中途半端感は否めないのですが、以前青空文庫を整理した時のツールを使って、お手軽に傾向を掴んでみようと思いました。

前処理

本は特集記事で選定済みの30冊(次のデータ内訳参照)。各本のAmazonレビューデータ(書評)を手作業でテキストファイル化、最後に全部入りファイルを生成。
AmazonのレビューデータってかつてはAPIが用意されていたみたいなんですが、今はiframeが返ってくるだけ…。データ作りはけっこうしんどかったです。

データ内訳

対象は以下の30冊です。

4163686800 4480688072 4847065506 4778312880 4797672757 4046004797 4041016495 48379823954061592998 4334786618 4794220049 4532165385 4794928122 4569654304 4309016553 4167111209 4837976913 4492042695 4594069967 4022731729 4309616747 4309616526 4396113218 4908087008 4480428542 4334035086 4480687645 4022735775 4061496840 400603024X

解析

テキスト解析用フリーソフトKH Coderを使用し、前処理した全部入りファイルを用いたRによる多変量解析を実施しました。

手法

(1)語の関係性(共起ネットワーク)、(2)語の分類(階層的クラスタ分析、多次元尺度構成法、自己組織化マップ)を実施。これも青空と同様ですが、今回、自己組織化マップについては1000回・2000回・3000回学習させてみました。

さてさて、けっこう長くなってしまったので、解析結果と考察は次にアップします。ということで今回はこれまで!

リンク