Twitter分析その2 発言内容でユーザーをセグメント
「Twitterユーザーは4タイプにわけられる」
前回のTwitter分析では、「発言」をテキストマイニングすることで、
ひとつひとつの発言を感情分類し、発言傾向を分析してみました。
(http://www.mm-lab.jp/news/12/)。
前回の「発言」の分類に対して、
今回は発言した「人」のタイプに焦点を当てたいと思います。
前回の発言者の他のツイートを拾い、
それぞれの人がどんな発言傾向があるのかを分析してみました。
さらに、その結果を#sb328とかけ合わせることで、
前回観測された異常値(4時間目と6時間目に急激に発言量が増えている)で
何が起こったのか推察してみました。
やや複雑なので、まずは分析フローです。
分析の詳しい手法等は省略しますが、
要するに「発言内容で人をタイプ分け」してみたんです。
▼クラスタ分析の結果
分析の結果、以下の4タイプのユーザーがいることがわかりました。
以上4タイプが、RT率、ツイート数、ツイートの内容によって区分できました。
▼タイプ構成比の経過時間別の変化
この分類に従って、#sb328の時間経過とともに
これら4タイプの構成がどう変化していったかをみてみます。
・前回 、異常値が出ていた4時間目について。
構成比の変化は、むしろ3時間目でボヤッキーが増えていることが目立ちます。
ここである種の問題提起が起こり、
4時間目でそれに対する意見が増えることで、
全体件数の急激な上昇があったのではないかと推測されます。
ログをみてみると、前回報告した広瀬香美さんの件の他に、
3時間目にボヤッキーの
「会場スタッフが来ていたTシャツが欲しかった、、、」に対して
4時間目にヨロコビーの
「自分も欲しい」「あれはよかった」のようなツイートが多くみられました。
・前回 のもう一つの異常値6時間目について。
ウケミーが6時間目から大きく増えています。
やや遅れて、ウケミーが盛り上がりに乗っかってきた様子をとらえていると思われます。
また、前回の分析でも6時間目の盛り上がりは内容的に特色があまりないことから、
ウケミーの仕業のために全体件数の2つ目の盛り上がりが観測されたのではないかと思われます。
実際にこの時間帯にウケミーによる追記コメントなしの
「RT @masason: 出来ました。出来ましたリストも検討リストも詳細を見れます。」
というツイートが非常に多く流れていました。
今回は、「発言内容で人をタイプ分け」にチャレンジしてみました。
このままでは解釈も推測の域をでませんが、
この分析をもう一歩進めることで、単純にネガな発言が増えても、
「いつもぼやいているボヤッキーからの発言であればそれほど深刻ではない」、
「しかしウケミーがRTし始めたら要注意」
といった評価が可能になります。
この他に、プロフィール文をテキストマイニングなんてこともおもしろそうです。
この後やってみたいと思います。
また、興味ある結果がでましたら、報告いたします。
可能かもしれません。
分析データ
前回取得した#sb328の1500ツイートのうち、2ツイート以上あった165アカウントを対象












