ベストセラーコード

「売れる文章」を見きわめる驚異のアルゴリズム
未読
ベストセラーコード
ベストセラーコード
「売れる文章」を見きわめる驚異のアルゴリズム
未読
ベストセラーコード
要約全文を読むには
会員登録・ログインが必要です
本の購入はこちら
書籍情報を見る
本の購入はこちら
おすすめポイント

まだ出版されていない小説が売れるかどうかを、発売する前に判別することができると聞いたら、あなたは信じられるだろうか。

本書が明かすのは、ベストセラーには特定のパターンがあるという事実だ。著者はコンピューターを使い、大量のベストセラーと非ベストセラーのデータを分析し、ベストセラーに共通するいくつかのパターンを見つけた。それに基づけば、なんと80%の確率でベストセラーを判別できるというから驚きだ。

一応注意をしておくと、本書は絶対に売れる本の書き方を指南するものではない。また、その分析に使用されるアルゴリズムの詳細な解説をするものでもない。あくまで、「売ってみなければわからない」というギャンブル要素の強い出版業界で、「少しでもおもしろい新人作家が発掘されれば」と願って書かれたものだという。

売れる本のトピックの割合、使われる動詞、キャラクターの感情の浮き沈みから見える最適なプロットなど、本書の分析対象は多岐にわたる。ぜひ今まで読んだベストセラーのことを思い返しながら、本書を読み進めていってほしい。本書が扱っているのはアメリカにおけるベストセラーだが、日本のベストセラーにも共通する要素が見いだせるはずだ。

小説家を目指す人や編集者はもちろん、読書が好きな人全般におすすめしたい一冊である。

ライター画像
池田明季哉

著者

ジョディ・アーチャー (Jodie Archer)
ペンギン(UK)でアクイジション・エディターとして勤務後、スタンフォード大学で英文学の博士課程を修め、アップルに入社。文芸(literature)分野の研究員として勤務。現在はフリージャーナリストとして活動している。

マシュー・ジョッカーズ (Matthew L. Jockers)
スタンフォード大学 Literary Labの創設メンバーの一人。現在はネブラスカ大学で英文学の准教授を務める。計量文献学(Stylometry)とテキスト・マイニングの第一人者として知られ、ジェイムズ・ジョイス『ユリシリーズ』などの古典英文学作品を中心に研究を続けてきた。ニューヨーク・タイムズ、LAレビュー・オブ・ブックス、サンデー・タイムズ・オブ・ロンドンなどの主要メディアのコラムニストとしても活躍。

本書の要点

  • 要点
    1
    大量のデータの分析から、ベストセラーの予測は可能である。
  • 要点
    2
    作家のブランドを確立するためには、全体の3分の1を同じトピックにするべきだ。また、トピックを詰め込みすぎてはならないが、ふたつの衝突するようなトピックを並べるのは物語を進める上で有効である。
  • 要点
    3
    プロットの基本は三幕構成である。特に最初の40ページで読者を引き込む事件が必要である。
  • 要点
    4
    文体は話し言葉に近いものがよい。余計な形容詞や副詞は使わず、簡潔なものが好まれる。
  • 要点
    5
    キャラクターに使われる動詞は行為主体性があり、意思がはっきり感じられるものがよい。

要約

【必読ポイント!】 ベストセラーは予測可能

ベストセラーは80%の確率で当てられる
Voyagerix/iStock/Thinkstock

ニューヨーク・タイムズ紙のベストセラーリスト入りした作品は、たまたま売れたわけではないし、市場は一般に言われているほど予測不能ではない。ジャンルにかかわらず、ベストセラーには共通する隠れた特徴がたくさんある。そうした特徴は、私たちがなぜ本を読むのかということについて、新しい考察を与えてくれる。

アルゴリズムを利用すれば、出たばかりの本やこれから出る本がベストセラーのDNAを持っているかどうかを調べることが可能だ。実際、コンピューター・モデルに原稿を読ませて、数千という特徴を調べさせた結果、ヒットする小説には特有のパターンがあることがわかった。

著者たちが作成したモデルを使えば、研究用に集めた本のなかから、80%から90%の確率でベストセラーかどうかを見分けることができる。一例を挙げると、J・K・ローリングの作品がベストセラーになる確率は95%、ジョン・グリシャムは94%、パタースンは99%だった。

なお、著者たちがベストセラーの成功の要因を解き明かしたいと思うのは、金銭的な動機によるものではない。絶滅の危機にさらされている出版業界で、生命力のある新しい原稿を見つけることが、業界の維持、さらには多様化に役立つのではないかと考えているからである。

コンピューターが本を「読む」とき

もちろん、コンピューターは私たちのようには本を読めない。コンピューターにできるのは、インプットされた情報を受け入れ、その情報を文字、コンマ、単語、文、章などに分解して分析することだ。しかしパターン認識にかけては、コンピューターのほうが人間よりもはるかに上である。

その本の特徴を見つけたあと、コンピューターはそれをもとに別のプログラムを使って、潜在的なパターンを分析する。この分析工程では「機械学習」と呼ばれるコンピューターの能力を利用し、類似性を基準に文書を分類する。たとえばメールソフトの場合、スパムメールにはスペルミスや「バイアグラ」などのよく見られる共通の単語があるので、そうした情報をもとにメールを分類している。小説の分類も、このメールのフィルター機能のようなものだ。すでにベストセラーになった本と売れなかった本を大量に用意して、それらをコンピューターに投入し、明確な特徴をもとにふたつに分けるようコンピューターを訓練するのである。

とはいえ、本書はアルゴリズムについての本ではない。本書を読んで、あらためて読み手、あるいは書き手としての自分を振り返ったり、小説の目的や好きな作家、嫌いな作家について思いをめぐらせたり、さらには人間と機械の関係についても考えていただきたい。

売れるトピックの選び方

トレードマークとなるトピックが必要
BrianAJackson/iStock/Thinkstock

小説を構成しているのは、様々な順番で並んだ言葉、すなわち言語のブロックである。これによって人は小説を「体験」する。このブロックの中には名詞が多く含まれており、それらによって小説の作者はトピックを、さらにはテーマを読者に届ける。

著者たちの分析の結果、ベストセラーに共通するジャンルは

もっと見る
この続きを見るには...
残り2615/3906文字

3,400冊以上の要約が楽しめる

要約公開日 2017.08.28
Copyright © 2024 Flier Inc. All rights reserved.
一緒に読まれている要約
ヒルビリー・エレジー
ヒルビリー・エレジー
関根光宏(訳)J.D.ヴァンス山田文(訳)
未読
ネットメディア覇権戦争
ネットメディア覇権戦争
藤代裕之
未読
「ポスト真実」時代のネットニュースの読み方
「ポスト真実」時代のネットニュースの読み方
松林薫
未読
日本人だけが知らない砂漠のグローバル大国UAE
日本人だけが知らない砂漠のグローバル大国UAE
加茂佳彦
未読
金融e時代
金融e時代
万建華
未読
宅配がなくなる日
宅配がなくなる日
松岡真宏山手剛人
未読
簡素な生き方
簡素な生き方
シャルル・ヴァグネル山本知子(訳)
未読
ヒットの崩壊
ヒットの崩壊
柴那典
未読