"網軍分身" vs "正常使用者" Classification

編輯歷史

時間 作者 版本
2017-07-07 17:35 – 17:35 (unknown) r0 – r1
顯示 diff
+ "網軍分身" vs "正常使用者" Classification
+ *理想結果
+ *
+
+
+
+ *Why? :為什麼要做這個
+ *PTT 上站人數異常 有養分身嫌疑 http://www.appledaily.com.tw/realtimenews/article/life/20150330/583462/
+ *阻止網軍影響言論的歪風
+ *或許可以提供給鄉民或版主參考 辨認不正常使用者
+
+ *How? :打算怎麼做,授權方式
+ *發展一套 Classification 演算法 判斷 "網軍分身" or "其他使用者" 可能也會有 "灰色地帶待觀察"
+ *授權 : LGPL
+
+ *Need?:需要哪些技術
+ *鄉民Marketing
+ *熟知PTT系統 鄉民文化
+ *Machine learning classification feature decision
+ *Big data collection
+ ======================================================================================================
+ *可能使用feature
+ *晚一點再來整理FB上大家給的建議
+ *資料收集
+ *工具使用
+ *Machine Learning Tool - Weka http://www.cs.waikato.ac.nz/ml/weka/
+ *非主流使用者分析: http://zbryikt.github.io/visualize/ptt-user/
+ *ptt 爬蟲: http://github.com/zbryikt/ptt-crawler
+ *google 條件搜尋 http://www.gtwang.org/2013/10/tips-use-google-search-efficiently.html
+ *