SBM研究会に参加してきた。

 という訳で、本日東工大大岡山キャンパスで行われたSBM研究会に参加してきました。とりあえずレポは後に回すとして反省点を先に。

  • 午後はベル係をやっていたのですが、パネルディスカッションではベル鳴らし忘れました。ごめんなさい。
  • 懇親会にも参加してきたのですが、お会計の段になってナチュラルに詐欺を働きそうになりました。某事務機メーカー平社員の方、ごめんなさい。

 という訳で、レポです。


 まずこの会に参加した目的ですが、私は卒研で『ソーシャルブックマークの利用実態とその存在意義』という大仰なテーマを選びました。というと実は順番が逆で、卒研のテーマを決めるときにネットについて研究したいけれどテーマどうしようと思い悩んでいたときにmixi内でこのSBM研究会の存在を知り、そうだ!SBMについて調べよう!と思い立ちました。特に私は、SBMをどう有効活用するのかというよりもSBMを利用していない人たちはどうしてSBMを利用していないのか?について調べたいと思いました。SBMをどう有効活用するのかということについてはバリバリに情報系の方々がやってくれていると思ったので、ではその利用者のパイを広げるのにはどうしたらいいのか?ということをアンケート調査でなんとか浮き彫りにしたいというのが私の目的です。多分この辺りの調査ってバリバリ文系の人は手を出さないだろうし、かといってバリバリに理系の人が手を出すにはあまりにも文系寄りすぎるテーマなので、私のように情報通信工学科という理系学科に所属しながら研究室は総合文化講座という文系研究室に入ったチャンポン人間がやるべき仕事ではないのか?という考えによります。まぁ、アンケート調査というのが卒論としてわかりやすく取り組みやすそうだったという目論見も当然ある訳ですが。と言う訳で、そんな思いを抱えながらSBM研究会に参加してきました。


 レポですが、自分が気になった点を、時には私自身の解釈も含めて箇条書きにし、あとから感想という手法をとらせていただきます。
 まず開催者の西谷さんからご挨拶があったあと、最初はスラド編集者の横田さんの講演から。

スラッシュドット編集者横田さん 『ソーシャルメディアとマーケティング』

  • やる夫は最強ブロガー
  • SBMの特徴四つ。
    1. オンラインで完結。
    2. 階層型ではない。
    3. 他者との共有。
    4. タギング、コメント。
  • オンラインブックマークの歴史
  • del.icio.us以降、SBMは日々のツールとなった。
  • SBMは現状7%のユーザしか使ってない。
  • 今後更にユーザを増やすか、パイの取り合いをするか。どちらかというと後者。
  • オープンなSBMからクローズドなSBMへ。

 個人的には、最初に書いた通りなるべくSBMの利用者のパイを広げたいと考えているので、クローズドで目的ごとに特化したSBMへ進むのではないかという横田さんのご意見は非常に考えさせられました。現状のSBMの技術が今のレベルのままでは、確かにその方向へ進むのがユーザにとってノイズが入りにくく一番いい形ではあると思います。けれどもそのノイズ除去というかユーザにとってSBMを有用なものにするためには、mixiのようにユーザをコミュニティとしてクラスタリングしたり、ユーザがWebページにつけたメタデータを元にコンテンツ推薦を行うなどの、技術的な進化と言うか技術的な対応でなんとかするべきではないのか?と思いました。しかしながら、SBMについてやりたいと思っているのにSBMの歴史を全く知らなかった私には、横田さんの講演は非常にためになりました。あと、やる夫は最強ブロガーという考えに非常に共感しました。やる夫は最近はキリストにまでなっちゃいましたからね。ほんと最強ですよ。

東工大宮田助教&博士課程佐々木さん 『SBMデータを用いたWebコンテンツ推薦』

宮田助教
  • SBMはタギングによりWebをFolksonomy的に分類できる可能性がある。しかし現実には課題もたくさん。
  • (単一の)タグが(単一の)コンテンツを特定する能力は、時間が経つにつれて低下する。エントロピーは増大するから考えてみれば当たり前。
  • SBMデータを使った情報推薦は多くの検討が広義の協調フィルタリングを使用している。
  • 協調フィルタリングの課題としては、ユーザの趣味があらゆる点ですべて一致することはないことと、データが十分に密でないと意味をなさないところ。
  • タグに使われている単語は飾り。タグの役割はアイテムのグルーピングだけと割り切ったとき、新しいコンテンツ推薦の形が見えてくる。
佐々木さん
  • Folksonomyの根底には協調的タギングという性善説があるが、SBMをする人たちは別に他人のためにタグをつけてやる必要なんてなく、事実みんな好き勝手にタグをつけている。
  • タグによる個人のアイテムグルーピングに着目すると、統計的信頼性を考慮した協調フィルタリングが出来る。

 佐々木さんの発表は後半になると難しい数式とかが出てきたりしたんですが、以下は自分なりの解釈を存分に入れて書きます。

  • AさんがhogeというタグをつけたWebページとBさんがpageというタグをつけたWebページがある程度重なっている場合、この二つには関連性があると見なして互いにコンテンツ推薦ができる。
  • しかし、単純にこの手法を使うとタグを比べる時に使うWebページ数が少ないときでも多いときでも同じだけの、場合によってはWebページ数が少ない方が多いときよりも高い類似度が出てしまい、信頼性が低い。
  • ここで二つのタグの類似度を計算するときに、尤度の対数比を使う。
  • 尤度とは、その名の通り尤もらしさ。たとえば、1/2の確率で表が出るコインP1と1/5の確率で表が出る小細工がしてあるコインP2の二つがあり、あるコインCがどちらであるか判定するときに、100回振って51回表が出たとき、その尤度はP1の場合0.0780。しかしP2の場合の尤度は3.97×10^(-12)。この場合の二つには大きな差があるので、高い確率でこのコインCはP1に分類されると推測できる。しかしこのコインCを2回振って1回表が出たとき、その尤度はP1の場合0.500、P2の場合0.32と非常に近い値になるので、この尤度を比較してもコインCがP1なのかP2なのか信頼性を持って答えられない。このように、尤度を比較してこそ信頼性を考慮することができる。
  • この尤度の対数比をとると、その数値的性質は次のようになる。hogeとpageを比べたとき、hogeというタグとpageというタグをつけられたWebページが両方とも少ないと低く出る。またhogeもしくはpageというタグがつけられたページのどちらかがもう片方と比べて極端に少ない場合も低く出る。そしてhogeというタグをつけられたWebページとpageというタグがつけられたWebページが両方多いときにのみ、大きな値をとる。
  • この尤度の対数比をタグの類似度として利用した場合、非常に有用だった。

 この研究は非常に興味深かったです。統計的信頼性を考慮した協調フィルタリングということで、あえてタグの名称には着目しないという点が非常にユニークだと感じました。この手法の場合、データが十分に密ではない場合に間違えて高い類似度を算出してしまうことはないのが優れていると思いますが、しかしこの手法を用いてもなお前半で宮田助教が指摘していた通り高い類似度を得るためにはデータが十分に密でないといけません。その十分に密なデータをどう作るのか?そこを社会学的(?)に研究するのが私の仕事だと思いました。

お昼休み

 ここでいったんブレイクタイム。宮田助教、佐々木さんとバイトの同僚のさんにその同僚さんと同研究室の方と一緒にお昼ご飯を食べてきました。地元のおいしいお店を紹介していただけて、大変うれしかったです。私は知らない土地に行くとなるべくチェーン店には入らず、地元っぽいお店にあえて挑戦するということを趣味としています。そのことを私は孤独のグルメごっこと呼んでいると話したらちょっとだけうけて、それもうれしかったです。

コモンズ・メディア代表 星さん 『Webの世界に「気付き」を集積するコモンズ・マーカー』

  • Webにメモ、Webをメモ、両方欲しい
  • ソクラテスは動的な対話こそを静的な文書などよりも尊いものだと考えた
  • Webページ上にメモを残しそれを共有することによって、人々の知的共同作業を支援したい。
  • Webページ上にマークとコメントを残し効率よく閲覧できるアノテーション機能と、俊敏にウェブログを記録できるミニブログ&ソーシャルブックマークという機能を備えたサービス

 このサービスについては、まだ自分が試していないのも存分にあるでしょうが、正直に話しますとその有用性には懐疑的です。Webページ上にメモを残すサービスとしては以前ニコニコブックマークがありましたが、そのサービスがはやらなかったのはWebページの中にコメントを残し共有する上で、擬似的にしろライブ性というか同時性が必要だったのに、それを上手く提供できなかった点にあると考えています。自分が知らないうちにメモを残されても、それに対する反応が出来ない。メモを残した側も、自分が残したメモにどんな反応があったのかリアルタイムで知ることができない、その静的な時間が、特にニコニコ動画ユーザにとっての何よりのネックだったのだと思います。これと同じ轍を踏むのではないかという点が非常に気がかりです。
 共同編集という作業をWeb上でやりたいと星さんはおっしゃっていましたが、いままでのオフラインでの共同編集には必ず時間的な制約によるリアクションの変化やレスポンスというものがありました。だからこそ、『共同』で作業を進める意味があったのではないかと思います。もしそれをWebの世界に持ってくるとしたら?Wikiのように共同作業でページを編集するとはいえど編集者間の情報のやり取りは全く(と言っていいほど)無視する代わりに時間的な制約も無視する、という形にするか、編集者間の情報のやり取りはある程度能動的に作られたコミュニティの中で時間性を持って行い、Webページに対するメモはそのコミュニティ間で共有するという形にしなければ、厳しいのではないかと思います。もちろん、これとは全く別軸でWebページの編集とそのWebページに書かれたメモの時間差に対する解決が見られれば、それでいけると思います。というより、つけられたメモをどう能動的に生かすのか?生かさせるのか?ということに答えを見つけられたら、それが静的な(コンテンツ的な意味で)ブログなどのページを動的に変化するページに変化させるタネと仕掛けになると思います。
 その点にどんな答えを魅せてくれるのか?それとも私のこの懸念自体が間違いなのか?この先注目のサービスです。

フランステレコム株式会社井口さん 『お前のモノ(ブックマーク)は俺のモノ、俺のモノ(ブックマーク)も俺のモノ』

  • ブックマークはきわめてプライベートな情報であり、これを隠しながらもSBMの利点であるコンテンツ推薦サービスなどを受ける仕組みを匿名P2Pを用いて実現する
  • みんなで分類、みんなで評価、みんなでコメント、みんなで推薦
  • プライバシーに関わる情報についてもう少し慎重になるという考えがあってもいいのではないだろうか?

 この辺りから先、正直私には理解の及ばない話が多かったです。自分のブックマークを隠しながらもコンテンツ推薦を受けたいという点については同意できるのですが、それをどう技術的に解決するのかについては話を聞いていてもよく分かりませんでした。ごめんなさい。私なんかはある意味でWebを信頼しきってしまっているというか、Webサービスを行っている会社でそうそうプライバシー情報を悪用するところはないだろう、もしされたとしても自分の趣味動向がWeb上に公開されることに対して割と鈍感な人間なので、自分のブックマークを隠したいのならばプライベートモードを利用すればいいのでは?などと身も蓋もないことを考えてしまいました。そこをあえて考え直す時期が来ている、というのはこんな考えの人間なので非常に身につまされましたが。
 とりあえず、P2Pコネクション確立の時点から他人のノード情報を自分のものだと嘘をついてコネクションを確立する、たとえ情報が嘘でもコネクション自体は有用、そうして確立されたコネクションの上でブックマークを交換する、という話ではないかと思うのですが、どうして嘘をついて確立したコネクション上で自分の望むブックマーク情報が手に入るのか?その肝心なところがてんでわかりませんでした。
 今回勉強したことというのがありまして、私はグラフに非常に弱い人間みたいです。グラフとして図示されると、その座標軸の単位が何なのかよく分かってなくても何となく納得してしまうという悪癖があるみたいです。
 分からなかった肝心なことについて質問しようという気すら起きなかったのは、本当に改めなくてはなりません。

産業総合研究所小島さん 『ソーシャルグラフってどうよ?』

  • ソーシャルグラフとは、ユーザを特定する情報を頂点としユーザ関係などを辺とする有向グラフ
  • 類似推薦じゃない推薦ってどう?

 これも井口さんのお話と同じく難しかったです。いかんなー、去年一年はグラフ理論アルゴリズムを研究している研究室にいたのに、このお二方の話が分からんとは、本当にいかんなー。ただ、GoogleFacebookが各サービス間でのユーザ関係を個人同定、友人同定できるだけの情報としてそろえており、それを活用するためのAPIがあるということははじめて知りました。私自身は大きく分けてネット上ではこのKZEというユーザと、もう一つ別のユーザとして存在しているつもりなのですが、いろんな都合から完全に分断して使い分けている訳ではないのでもうGoogleさんやFacebookさんに補足されているのかもしれないのですね。このソーシャルグラフというものの存在については全くの想像外だったので、久々にWebに情報を出すことについての怖さを感じました。
 サービス間を超えて友人関係を簡単に保ち続けたい、という動機も分からないではないですが、個人的にはサービスが変わればその都度友人関係も変わる、もしサービスを超えて友人関係を保ち続けたい人がいればその都度友人として登録し直すのが当たり前だと思っていたので、本当にこの話は怖かったです。
 あと最後に小島さんがおっしゃっていた類似推薦じゃない推薦、というのは、実はランチタイムに宮田さんなんかも言及していた点でありまして、完全なランダムじゃないんだけど意外性がある推薦はその意外性の定義が難しいから難しいという感じの(うろ覚えですが)お話をされていました。意外性がある推薦、といってすぐに思い浮かぶのはニコニコ市場です。あれは完全に人間ベースのものなので非常に精度のいい類似推薦であるのですが、同時に時折「市場自重w」と言われるような意外性のある商品が登録されていることのある、類似推薦以外の推薦という意味を持ったシステムとしてはおそらく世界の最先端を走っているものなのではないかと思います。それをコンピュータ的にどうするのか?といったことは非常に難しいのは確かで、そこの突破口がソーシャルグラフにありそうだから小島さんはこの講演の最後に類似推薦じゃない推薦、という話を持ってきたのだろうかと思いました。う〜ん、いろいろこの文章を書きながら考えてるぞ、私。

筑波大学修士課程神林さん 『私がチャレンジしたSBMデータマイニング

  • これからのSBMは、はてブのお気に入り機能など人と人の関係を使うのが大事

 本当に集中力とか途切れてきてすみません。話を聞いていたときも、これを書いている今も。とりあえずベイズ理論とか本当に少しは耳慣れた単語が入ってきたりしたのですが、そうした具体的なデータマイニング手法よりももの作りに対する姿勢について学ぶところが大きかった講演だったと思います。こんなものがあったらいい、それを形に出来る人は、出来るかどうかも当然考えるのでしょうが、でもそれ以上に息をするのと同じくらいに作りたいものは作るのが当たり前と考えているのでは?と神林さんが作られた数多くのWebサービスの例をと、それに対する神林さんのまるで当たり前のことを説明するかのような解説を聞いて思いました。私自身はというと、作りたいWebサービスとか考えてはみるもののそれを作るところまでいけない、途中まで作っても飽きてしまう、完成させられない、という非常にダメ人間なので、神林さんからはもの作りに対する姿勢をもっと聞けたらなぁと今になって思いました。本当に質問すべきは Future of SBM ではなくてそこだったのかもしれない。

パネルディスカッション

 これはモデレーターの西谷さんの進行が非常に上手く、ものすごく引き込まれてしまったパネルディスカッションでした。思わずメモをするのをほとんど忘れてしまったり、ベルを鳴らすという役割を忘れてしまうほどに。その割には内容がよく思い出せません。ダメじゃん。とりあえずSBMを広めたい!と思っている私としては、社内SBMですら3割くらいの人が使ってくれないというのが結構ショックでした。でも、逆に考えてみると横田さんの指摘にもあった通り一般のネットユーザの7%しか使用していないSBMを7割の人が使ってくれているというのをすごいと考えるべきなのかもしれません。ただ、母集団がITのプロフェッショナルだということは差し引く必要があるでしょうが。ちょっと今日はもう遅いので、この段などについてはあとから思い出したら何か書き足すかもしれません。

全体の感想

 行ってみてよかったです。自分の研究の為になる話が聞けたというのも大きいのですが(というかこの研究会があるから自分のテーマが決まったのでそれはある意味当たり前ですが)、やっぱりいろんな人の話を生で聞けたのが大きいなと思いました。こうした勉強会やオフ会などに半分勉強半分趣味で顔を出すようになったのは本当に最近の話なのですが、そこに集まった人と浅かったり深かったり時には脱線したりしつつ話をするのが非常に楽しかったです。個人的には休み時間にある方とちらっとした話がまた興味深かったので、ちょっと別エントリで書こうと思っています。こうしてみると、星さんがプレゼンでおっしゃっていた『ソクラテスは対話に重きを置いたから著作は残さなかった』という話も、一段と重みを増して感じます。それと、今回西谷さんが感想を書いてほしいというお願いをされていたので感想をこうして長々と書いてみたのですが、感想を書くことというかインプットをアウトプットに直すことをすることも非常に大事だと実感いたしました。確実に理解が深くなります。そうしたことを気付かせてくれたことも含めて、本当に今回のSBM研究会は行ってよかったです。
 主催者の西谷様、パネラーの皆様、そして参加されたすべての皆様、どうもありがとうございました。