読書的な何か。

読書と読書にまつわるテクノロジー、雑記など。

人工知能型出版プラットフォーム

はじめに

ドイツに人工知能を活用した出版プラットフォームがあるという記事を読みました。

getnews.jp

「Inkitt」は、2万人以上の書評家、ブロガーらを含む読者と作家を直接つなぐオンラインコミュニティでありながら、人工知能による“データ駆動型出版エージェント”の役割を担っているのが特徴だ。

データ駆動型とは、読書の閲読パターンや人口統計学的な属性などから、ヒットしそうな作品を予測することをしているそうです。実際、どんな計算をしているのでしょうか。

調べてみた

まずはこの記事を読んでみました。

www.inkitt.com

読み進めていくと、

Based on the algorithm that we have developed that analyses reading patterns, we can predict much better if a book has the potential to reach a larger readership upfront, based on crowd wisdom.

なるほど、「the algorithm that we have developed」へのリンクがあるので、このリンク先に計算の考え方がありそうです。以下がリンク先。

www.inkitt.com

まぁ、予想していましたが、やんわりとした文章で人工知能アプローチがいかにすごいかは書かれていますが、それがどんな仕組みかは書かれていませんでした。実際に、Inkittにユーザ登録して、試してみなさい、と。

This enables us to make objective and data-driven decisions on whether a story has the potential to become a bestseller. This is all based on the behaviour of your readership – even if you only have a few readers in the beginning.

ここでのThisは読者の閲読パターンを解析するAIアルゴリズムを指しています。そのアルゴリズムがあれば、最初は数人の読者であっても、その読者が求める傾向がわかるのだとか。

ううーん、気になる。でも、限られた時間ではこれ以上調べることができませんでした。学会関係とか特許関係を調べてみると、もう少し手掛かりがあったかもしれないなぁ。

考えたこと

少し前に、ピケティ本『21世紀の資本』の電子書籍版でハイライトされたページ数を調べたところ、700ページもある大作なのに26ページ目までしか読まれていない、という分析がありましたが、おそらくInkitt社はもっと精緻に様々な角度から閲読パターンを分析しているのでしょう。

news.careerconnection.jp

doksyo-tekの中ではかなり一世を風靡した『ベストセラーコード』は、どちらかというとベストセラーの本文そのものを解析する、テキストマイニングと計量文献学の世界のお話でした。それに対してInkittは本文のみならず、それを読む読者の性質、本と読書の関係までも解析することで、読者が欲している嗜好を明らかにし、加えてその嗜好を本文に反映してしまおうとする、非常に野心的な取り組みを行っています。

こういうスタートアップが増えてくると、出版界も楽しくなりますね。今回はInkittのAIアルゴリズムを探しきれませんでしたが、どのように解析しているのか、引き続き調査したいと思います。 

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

 

 おまけ

せっかくなので、ユーザ登録してみました。興味のあるジャンルの登録作家の文章が読めるし、自分でも書ける(そしてそのフィードバックを会員からもらえる)ようになっています。一見すると、いわゆる本のSNS。でも、ここではユーザ同士のコミュニケーションが行われるのだけではなく、裏側ではAIが動いており、何がどのように読まれたのか、解析されているというわけです。

f:id:doksyo-tek:20171105030449p:plain

図1 まずは興味の登録

f:id:doksyo-tek:20171105030540p:plain

図2 様々な物語が並んでおり、、

f:id:doksyo-tek:20171105030601p:plain

図3 実際に読むことができます

f:id:doksyo-tek:20171105030726p:plain

図4 自分でも書けるようになってます

f:id:doksyo-tek:20171105030757p:plain

図5 コミュニティが活性化するようなイベント企画もたくさん