Twitter分析その2  発言内容でユーザーをセグメント
「Twitterユーザーは4タイプにわけられる」

このエントリーをはてなブックマークに追加

前回のTwitter分析では、「発言」をテキストマイニングすることで、
ひとつひとつの発言を感情分類し、発言傾向を分析してみました。
http://www.mm-lab.jp/news/12/)。

前回の「発言」の分類に対して、
今回は発言した「人」のタイプに焦点を当てたいと思います。

前回の発言者の他のツイートを拾い、
それぞれの人がどんな発言傾向があるのかを分析してみました。

さらに、その結果を#sb328とかけ合わせることで、
前回観測された異常値(4時間目と6時間目に急激に発言量が増えている)で
何が起こったのか推察してみました。

やや複雑なので、まずは分析フローです。

分析の詳しい手法等は省略しますが、
要するに「発言内容で人をタイプ分け」してみたんです。

▼クラスタ分析の結果

分析の結果、以下の4タイプのユーザーがいることがわかりました。

以上4タイプが、RT率、ツイート数、ツイートの内容によって区分できました。

▼タイプ構成比の経過時間別の変化

この分類に従って、#sb328の時間経過とともに
これら4タイプの構成がどう変化していったかをみてみます。

前回 、異常値が出ていた4時間目について。

構成比の変化は、むしろ3時間目でボヤッキーが増えていることが目立ちます。
ここである種の問題提起が起こり、
4時間目でそれに対する意見が増えることで、
全体件数の急激な上昇があったのではないかと推測されます。

ログをみてみると、前回報告した広瀬香美さんの件の他に、

3時間目にボヤッキーの
「会場スタッフが来ていたTシャツが欲しかった、、、」に対して

4時間目にヨロコビーの
「自分も欲しい」「あれはよかった」のようなツイートが多くみられました。

前回 のもう一つの異常値6時間目について。

ウケミーが6時間目から大きく増えています。
やや遅れて、ウケミーが盛り上がりに乗っかってきた様子をとらえていると思われます。
また、前回の分析でも6時間目の盛り上がりは内容的に特色があまりないことから、
ウケミーの仕業のために全体件数の2つ目の盛り上がりが観測されたのではないかと思われます。

実際にこの時間帯にウケミーによる追記コメントなしの
「RT @masason: 出来ました。出来ましたリストも検討リストも詳細を見れます。」
というツイートが非常に多く流れていました。

今回は、「発言内容で人をタイプ分け」にチャレンジしてみました。
このままでは解釈も推測の域をでませんが、
この分析をもう一歩進めることで、単純にネガな発言が増えても、

「いつもぼやいているボヤッキーからの発言であればそれほど深刻ではない」、
「しかしウケミーがRTし始めたら要注意」

といった評価が可能になります。

この他に、プロフィール文をテキストマイニングなんてこともおもしろそうです。
この後やってみたいと思います。

また、興味ある結果がでましたら、報告いたします。
可能かもしれません。

分析データ
前回取得した#sb328の1500ツイートのうち、2ツイート以上あった165アカウントを対象