"網軍分身" vs "正常使用者" Classification
- Why? :為什麼要做這個
- PTT 上站人數異常 有養分身嫌疑 http://www.appledaily.com.tw/realtimenews/article/life/20150330/583462/
- 阻止網軍影響言論的歪風
- 或許可以提供給鄉民或版主參考 辨認不正常使用者
- How? :打算怎麼做,授權方式
- 發展一套 Classification 演算法 判斷 "網軍分身" or "其他使用者" 可能也會有 "灰色地帶待觀察"
- 授權 : LGPL
- Need?:需要哪些技術
- 鄉民Marketing
- 熟知PTT系統 鄉民文化
- Machine learning classification feature decision
- Big data collection
======================================================================================================
- 可能使用feature
- 晚一點再來整理FB上大家給的建議
- 資料收集
- 工具使用
- Machine Learning Tool - Weka http://www.cs.waikato.ac.nz/ml/weka/
- 非主流使用者分析: http://zbryikt.github.io/visualize/ptt-user/
- ptt 爬蟲: http://github.com/zbryikt/ptt-crawler
- google 條件搜尋 http://www.gtwang.org/2013/10/tips-use-google-search-efficiently.html
-