d|Bootcamp Taipei 共筆 - 資料在哪裡?

最後編輯:2015-08-21 建立:2015-08-07 歷史紀錄

SINGING L時間:2015/08/21 13:00 - 14:00

講師:王向榮 / SheetHub.com 共同創辦人

    SINGING L

RONNY Wslide: https://docs.google.com/presentation/d/1Vj0sAq3Pe-XasfiK-Qs5hpkN9fHqy8zDU1Aokrprtr8/edit?usp=sharing

  • LI-TING H找資料是第一步,也是最重要的一步。之前台大新聞社的同學還帶了攜帶式的掃瞄器進中選會蒐集選舉的數據,因為這些數據網路上找不到(?)。
  • 資訊公開 vs 開放資料 差別在哪呢?
    • BO-YI L資訊公開:政府把資料拿出來,讓民眾看得到(但不一定適合進行後續的資料處理)
    • 開放資料:政府把資料用特定方式,使民眾可以運用資料處理技術處理資料

eg. 內政部實價登錄網站

LI-TING H資訊:已經做好的菜,沒有辦法選擇菜色

資料:原料,可以做出任何菜

KAO(以肉絲炒飯及肉絲炒麵為例)

ALLEN Lgoogle search 可以”site:gov.tw" 只搜尋政府網站

 

CHAN ZJSON的優點:可存放較複雜的資料

缺點:檔案較大(但一定比XML小)

 

 

RONNY W連結:

 

練習範例1:

 

練習範例2:

練習範例3: 擷取分析PDF文件資料

  • http://tabula.dbootcamp.taipei:8
  • 080/
  • 下載安裝 Tabula http://tabula.technology/
    • LI-TING H用來把 pdf 裡面的表格資料轉化成CSV
    • RELAX選取表格時,範圍一定要大於表格。
    • Reapeat Selection(Reapeat this Selection)功能(在選取範圍的右下角會出現),用於若每一頁表格的範圍/位置都是一樣時,可以重複選取範圍。