Twist

twitterのツイートをstormでワードカウントしてつぶやきビッグデータみたいなものを表示する

Description

全公開ツイートの1%を抽出し、Stormに流す
Stormでワードカウントして、直近60分のワードカウントデータをJSONで出力する
D3jsでつぶやきビッグデータみたいなのを表示する

Eclipseを使ってこれをスタンドアロンでサクっと動作させることが可能です
分散環境でも動きます、Apache Ambariを使用して6台で動作確認済

Requirement

twitter開発者アカウント

srcフォルダ直下に以下の内容のtwitter4j.propertiesを作成

debug=true
oauth.consumerKey=****************
oauth.consumerSecret=****************
oauth.accessToken=****************
oauth.accessTokenSecret=****************

nginx

CreateAccount

Twitterアカウントを作成
携帯電話番号を登録して認証
https://apps.twitter.com/ にアクセスしてCreate a new applicationをクリック
[Name]、[Description]、[Website]を適当に入力
[Key and Access Tokens]タブの[Consumer key] と [Consumer secret] をメモ
[Create my access token] をクリックし[Access token] と [Access token secret] をメモ

Usage

nginxインストール、起動
tools/Rankings.java 161行目のjsonファイル出力先をnginxの公開ディレクトリに指定
公開ディレクトリにindex.htmlを置く
ブラウザでhttp://localhost:8080を開く

UserDictionary

resourses/dic.csvに除外したい単語(BOTが頻繁に使う単語とか)を入れておくとカウント対象外になる
resourses/user_dic.csvはwikipediaの見出しから作った辞書、使用すると負荷がかかるため注意（未使用）
SplitBolt.javaあたりを見てもらうと読み込むユーザ辞書の設定が可能

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
src		src
README.md		README.md
index.html		index.html
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Twist

Description

Requirement

CreateAccount

Usage

UserDictionary

About

Uh oh!

Releases

Packages

Languages

sft8192/Twist

Folders and files

Latest commit

History

Repository files navigation

Twist

Description

Requirement

CreateAccount

Usage

UserDictionary

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages