"Mynd Daily"では、 ユーザが記事タイトルをクリックして記事本体を読みに行ったかをチェックして、 ユーザの嗜好の特徴量を作成している。 「コールドスタート」問題 については昨日書いたが、 初日の推薦記事の中にたまたまあなたの好きな記事があったとしよう。例えば猫の記事。 あなたはその猫記事をクリックする。
すると、他に情報がないものだから、システムは唯一の手がかりに従って、 翌日の推薦では猫の記事を主に推薦する。 猫好きのあなたはまた猫の記事ばかり読む。 システムは、あなたは猫以外に興味のない猫フリークなのだ、 という確信を深め、翌日さらに猫記事を推薦する。 このループはどんどん深まり、サーヴィスが「今日の猫通信」みたいになってしまう。 しかし、(あなたは猫好きとは言え)それでよいのだろうか。 このように、システムと人間の関わりによって自動的に現れた情報の「壁」の中に、 どんどん閉じこもっていってしまう状況を 「フィルターバブル」と言う。 (多分、この言葉は情報の「壁」を見えない「泡」として想像しているのだろう。)
この問題は深い。少なくとも、 そもそも推薦システムをどう使いたいのか、 というサーヴィスの全体設計に関わる問題であることは間違いない。 例えば、インタネットで商品を売る web サイトを運営しているとしよう。 売れ行きをアップさせるために、推薦エンジンを入れることにした。 例えば、ピノ・ノワールを買ったお客にピノ・ノワールを薦める。 お客は喜んで買うので、さらにピノ・ノワールを薦める。また買う。また薦める。 ピノ・ノワールのフィルターバブルが発生する。 これは売り上げをアップさせるのだろうか。 そうかも知れないし、そうでないかも知れない。 ひょっとしたら、他の葡萄品種も紹介して、趣味の幅を広げてもらった方が、 もっと沢山買ってくれるのではないか。 つまり、このバブルによって、本当の売上アップのチャンスを失っているのではないか。 またお客の立場から言うと、お客の利便性は上がっているのだろうか。 さらに言えば、より幸せになっているのだろうか。 そうかも知れないし、そうでないかも知れない。 さらに深い質問としては、 幸せになっているとしても、それでいいのだろうか。
"Mynd Daily" は「あなた向けの今日のニュース」であるという立場からすると、 フィルターバブルをどう扱うべきだろうか。 ユーザによっては、「今日の猫通信」上等、という方もおられるだろうが、 おそらく多数派ではないし、我々が提供しようとしているサーヴィスではない。 そもそも何をしたいのか、ということを根本的に考えないと、 本当の答はありえず、そして正直に言ってしまうと、我々自身まだ良く分かっていない。 しかし、フィルターバブルを避けなければならないことは共通認識としてある。 つまり、ある程度のヴァラエティを持って、ユーザが興味を持ってくれそうな記事をとりそろえたい。 そのためには、ユーザが興味を持つと分かっていない(正確に言えば、システムがそう判断していない) 記事や、今のところ興味を持たないだろうと判断している記事すらも、提示する必要がある。 つまり、10 個記事を推薦して、10 個クリックされる状況は「満点」ではない。 実際、我々は推薦記事の中に、このような「外した」記事をわざと一定数、混ぜ込ませている。 "Mynd Daily" に登録してくださった方は、「どれが外し記事だろう」と想像してみるのも面白いかも知れない。
フィルターバブルの問題は深い。 アルゴリズムの設計、システムの全体設計、サーヴィスの構築の全てに関係すると同時に、 情報と人間の関わり方の本質に触れていて、哲学・思想にすら射程が拡がっている。 そこまで言わなくても、推薦エンジンを応用するときには、熟考しなければならない課題である。 また、もしあなたが商売のために推薦エンジンを導入しようとしているなら、 「コールドスタートはどうしますか」と「フィルターバブルはどう考えていますか」 の二つの質問をすれば、IT屋さんの方は「こいつは油断できないな」と思うし、 この質問にしっかり答えて、一緒に考えようとしてくれるならば、 信頼できる業者だと判断して良いと思う。
長い投稿が続いたので、明日、明後日はいつもの断腸亭日常的モード。 記事推薦の話の続きは、月曜日の夜。