都市計畫書資料三星化|方法討論

最後編輯:2017-05-31 建立:2015-08-25 歷史紀錄

 

    CHE L探討

CHE L摘自 Dongpo:TimBL 的開放資料五顆星所著重的點在於資料的開放性,因此第一顆星的開放資料就要是以開放授權釋出,若這資料還是結構化資料(非圖片,機器難以處理的),那滿足二顆星,如果進一步是非專屬格式,如 CSV,則滿足三顆星,若資料可以開放到,資料集中每一筆資料本身在網路中都有一個 URI 來指涉,就滿足了第四顆星的開放資料,一般做法就是以 RDF 的格式,因為有了URI,所以資料集中的資料可以透過語意相互連結,這就是五顆星等級開放資料,也就是常說的Linked Open Data。

 

摘自 au:在心態上,只要還是「先有資料 → 再來開放」,發佈變成產出的下游,中間的描述資料(metadata)就會流失,或是參差不齊。

 

摘自王祖修:我個人認為都市計畫書和圖應該分開處理。一來都市計畫書應該開始思考怎樣結構化,畢竟裡面充滿著跟全民有關的資訊,而卻用很不資訊結構的方式撰寫,二來都市計畫圖則是看其來源母圖資訊,有的是透過都市計畫樁和都市計畫區地形圖展繪,有的是與地籍圖套繪,而地籍圖卻又不全部都是數值重測區,這部分是可以好好討論一番。最後才是怎樣把都市計畫書中特殊的資訊和土管要點、限制連結到都市計畫圖,過去研究過並不是不能結構化,而結構化的好處更可以讓這部分資訊透明公開。

 

Richard Hsieh> 進行到現在對於書籍的資料結構化大概就是幾點需要克服

1. 每一本書的章節編排不同,是要統一,還是保持獨特性?

2. 表格的結構每個都不同,不能用單一個parser去處理

 

chewei>

  • 正面表列一些都市計畫書圖中,必定會出現的內容,例如:
    • 每一本「都市計畫通盤檢討案計畫書」,都會整理「歷年都市計畫案發布實施情形」,通常都是用表格的方式呈現,或許可以成為一個表格開放資料項目。
    • 「人民陳情意見綜理表」
    • ...
  • 主辦單位應該同時提供計畫書內的各種「OOOO現況示意地圖」的原始資料集或資料網址。
  • 換個角度來說,書圖資料開放,也是「都市計畫知識體系」的知識管理課題。
  • 開放都市計畫-南港區都市計畫通盤檢討
  • 所以什麼是三顆星等級的都市計畫書圖?
    • 一本都市計畫書=內文文字資料+地理範圍資料+人口推估資料+特定議題的表格+cc授權圖片...
    • 等號右邊各項資料皆符合開放資料三顆星等級,並且容易獨自抽出;各項資料或圖文的排版順序或之間的前後文位置也可以被機器所察覺;如此一來,民間可以較方便地重製都市計畫書圖,並且容易製成展示性、互動性高的書圖呈現方式,也可以依照民間觀點混搭更多資料來討論都市計畫內容,或是更多應用。
  • 「活」都市計畫書
    • 都市計畫內容中的援引資料,能否以「即時動態資料」、「依據開放資料來做計算」等方式呈現?例如人口資料、環境資料。
    • 分析程式碼可以考量釋出
    • 都市計畫通盤檢討原則自動化、定期演算...
    • 群眾通報與意見討論
  • 書圖內容中,若提到各種實體應有獨一無二的 id 可指涉 (像是縣市代碼、里、公共設施...)
  • 結構化的書圖資料,提供 API
  • [提問] 如果想要知道一個地理範圍內,(從古至今) 各種大大小小的空間變動事件,可以參考什麼樣的公部門資料來源?

 

摘自 Whiski Tajfun:我覺得在談這些東西與資料之間的關係時,應該要想到一個重點 : 為什麼要這樣做?第一個好處當然是搜尋時能更容易找到我們要的東西(不是靠全文檢索,然後靠不同的演算法去推論)。而第二個好處是,很多報告其實是綜合了更多其他的資料/資訊後彙整而成。那我們有沒有機會,透過這樣的拆解,讓一份報告只保留他核心的東西,剩下其他所有引用的數據,資料等,都可被視為模組後。只是在這邊被組合起來產生我們要的結果而已?

然後進一步,我們是否有機會,以後就只須要把模型建立好,各個不同模組(資料集)各自準備好,就可自動產生許多 routine 型的報告?例如外交部每年都會出的年報?

 

開放資料實作參考

 

 

    CHE L其他書圖開源化展示構想參考案例