【Lifehacks】Twitterの特定ハッシュタグに関する呟き数を分析する

■タスク
 Twitterの特定ハッシュタグに関するユーザ別呟き数を分析する。


■背景
 Twitterハッシュタグ「#twnovel」(Twitter小説)が面白く、継続的にチェックしたり作品を呟いたりしています。
 2009年11末時点で参加者約1600名、投稿約22000呟となっていますが、読んでいるうちに「呟き数ランキング」「呟き数別人数分布」などに興味が湧き分析してみたくなりました。


■方法
 以前紹介した幾つかの方法・ツールを組み合わせることで、色々な素材を整えます。


1.Twitterの特定ハッシュタグの呟きを一括取得する

2.STOT形式データをTSV形式に加工する

3.TSVの特定項目を抽出する

4.データリストの正規化を行う


 以上で正規化されたユーザIDの並びデータが得られるので、次のツールによって呟き数を集計します。


5.ファイルを縦に集計


 以上でユーザ別呟き数ランキング情報が得られます。
 本情報をExcelにて呟き数別に集計し、


・呟き数別百分率円グラフ
・呟き数別ヒストグラム


などを作成します。
作成結果


■備考
・本内容は、2009.10.03に開催された「twnovelオフ会」に持参した「twnovel分析資料」を作成した際の手順を整理したものです。
・「ハッシュタグクラウド」は個人運営のサイトであり、ログの完全アーカイブを保障するものではないとのことです。また現状でもなんらかの理由により参照できない情報があるとの報告もあります。
・残念ながら、呟きのタイムスタンプ等の情報を採取することができません。
・完全性が必要な場合、Twitter APIで何らかのツールを作成するか、そのようなツールを探す必要があります(良いツールをご存知の方がいたら、ご教示ください)。