都市計畫書資料三星化|方法討論

探討

摘自 Dongpo:TimBL 的開放資料五顆星所著重的點在於資料的開放性,因此第一顆星的開放資料就要是以開放授權釋出,若這資料還是結構化資料(非圖片,機器難以處理的),那滿足二顆星,如果進一步是非專屬格式,如 CSV,則滿足三顆星,若資料可以開放到,資料集中每一筆資料本身在網路中都有一個 URI 來指涉,就滿足了第四顆星的開放資料,一般做法就是以 RDF 的格式,因為有了URI,所以資料集中的資料可以透過語意相互連結,這就是五顆星等級開放資料,也就是常說的Linked Open Data。

摘自 au:在心態上,只要還是「先有資料 → 再來開放」,發佈變成產出的下游,中間的描述資料(metadata)就會流失,或是參差不齊。

摘自王祖修:我個人認為都市計畫書和圖應該分開處理。一來都市計畫書應該開始思考怎樣結構化,畢竟裡面充滿著跟全民有關的資訊,而卻用很不資訊結構的方式撰寫,二來都市計畫圖則是看其來源母圖資訊,有的是透過都市計畫樁和都市計畫區地形圖展繪,有的是與地籍圖套繪,而地籍圖卻又不全部都是數值重測區,這部分是可以好好討論一番。最後才是怎樣把都市計畫書中特殊的資訊和土管要點、限制連結到都市計畫圖,過去研究過並不是不能結構化,而結構化的好處更可以讓這部分資訊透明公開。

Richard Hsieh> 進行到現在對於書籍的資料結構化大概就是幾點需要克服

1. 每一本書的章節編排不同,是要統一,還是保持獨特性?

2. 表格的結構每個都不同,不能用單一個parser去處理

chewei> 

摘自 Whiski Tajfun:我覺得在談這些東西與資料之間的關係時,應該要想到一個重點 : 為什麼要這樣做?第一個好處當然是搜尋時能更容易找到我們要的東西(不是靠全文檢索,然後靠不同的演算法去推論)。而第二個好處是,很多報告其實是綜合了更多其他的資料/資訊後彙整而成。那我們有沒有機會,透過這樣的拆解,讓一份報告只保留他核心的東西,剩下其他所有引用的數據,資料等,都可被視為模組後。只是在這邊被組合起來產生我們要的結果而已?

然後進一步,我們是否有機會,以後就只須要把模型建立好,各個不同模組(資料集)各自準備好,就可自動產生許多 routine 型的報告?例如外交部每年都會出的年報?

開放資料實作參考

其他書圖開源化展示構想參考案例