政府開放資料政策 review

Updated

本文內容將於 2014/5/1 中午12:00由與會者彙整後,5/1 下午寄出給科技部做 5/2 與談的參考。內容整理完亦會將唯讀文件連結公佈於此。5/1 中午後在此更新的建議,將不會包含在該份文件中。→ 文件

會議紀錄 https://docs.google.com/document/d/1IRdyS_jkChZRTT90GqCJbXlKQxnzCtiRwBovN_Dc7JI/edit?pli=1

延伸五顆星驗證討論

https://g0v.hackpad.com/529BJcUTTmS

前情提要文件

科技會報/科技部方面來函,邀請 g0v 的朋友在 2014/5/2 參與座談,提出對政府目前推行 open data 政策的回顧與建議。

以下為共筆彙整社群想法,授權以 CC-BY 4.0 g0v contributors : (pofeng , jimmy huang ,Passerby, muyueh, tkirby ☜請簽名) 釋出。(現況分析、陳述請共筆,想法建議請直接寫 "自己 id> 想法.... ")

對應於國際的作法,我國的政府資料開放,有無更需改進之處?(如資料集領域/內容、數量、是否具有價值,或符合企業與人民的期望?)

  • 開放資料的方向?
  • Jimmy Huang> 無論是英國的開放資料白皮書(Open data White Paper),還是美國的開放政府(Open Government)政策,都有明確的階段性規劃,但比照英國的白皮書,台灣看起似「超前」許多直接跳到加值應用階段,舉辦的比賽、補助、開設的 data.gov.tw 資料清單網站,令人摸不著頭緒開放資料的目標為何。例如,科學研究是不是目標?政府透明是不是目標?還是經濟提昇才是目標?

    hc>其實根據政府資訊公開法來討論,根據第七條規定:

    johnny>補充監察院部分,財產申報為圖檔不利資料分析與重用,政治獻金部分,監察院公報廉政專刊有總數資訊,但細項條目須民眾親自到監察院查詢,且僅能影印不可將資料以電子檔形式帶出,。

    shelling> 補充經濟部商業司部分。「營業項目登記代碼表」和「公司登記」列表和「商號登記」列表三項,都是屬於政府必須公開且已公開資料。同樣資料不利機器閱讀,無法供第三方有效利用。另 OpenData 在這類開放性資料也可以設計讓民眾直接反饋更新資料的方式,例如線上更新公司登記資料,以降低公務員人力資源的耗費,提昇洽公便利性。

    tkirby> 我用開放資料到現在有種感覺, 

     1. 完全自由使用的資料都是與政治完全無關的資料, 品質也常有問題 (更新頻率或是正確性等等的)

     2. 需要付費下載的都多少會牽扯到商業利益, 像地籍資料等

     3. 資料開放往往會是避免爭議大於開放, 

        所以很多資料會以"避免違反個資法"之類的理由限制資料細節 (比方說實價登錄或是犯罪案件資料), 

     4. 若是政治敏感的資料則通常不僅要付錢, 還不容易取得, 像政治獻金即為一例. 

    上頭這四點多少可以看出國家目前對開放資料的態度, 簡單的說, 就是:  「怕出事」

    我想若從制度上能讓公家單位對開放資料這件事正向思考對推動開放資料會有很大的助力.

    tkirby> 很多資料都以統計過後的形式釋出, 可利用的價值會比較低. 建議可以同時提供統計過後的資料以及原始資料. 比方說, 與其提供各縣市犯罪率, 不如提供各鄉鎮 / 警察單位轄區犯罪數; 與其提供各鄉鎮犯罪數, 不如提供各筆案件發生時間地點.

    wHisKy > 一個問題,台灣為什麼要做開放政府資料?目前的作法基本上分為兩套,一是對內,偏向政府組織改造(加強對政府資料的盤點,統計,紀錄,公佈。還有法令方面的修改),另一個是對外,強調經濟發展,將開放資料做為一個產業來推動。對內組織改造的部分,從法規與現有資訊架構都有很多問題需要一一處理。對外推動,開放資料從來都不是一個產業,但是資料處理運用等會是一個產業。開放資料是一個可以套在許多不同領域產業上的概念,就如自由軟體的運用一般。所以,目前台灣在推動開放資料這一塊,從基本上就錯了。後面的作法也只是在錯上加錯,努力彌補基礎上的不足。

    在推動開放資料這一塊,目前沒有法源基礎,引用的是政府資訊公開法。但是開放資料講的是資料的運用,從法源上來看,和目前討論要修編的著作權法會有更大的關係。所以要在台灣推動開放政府資料,這兩個法令的修訂絕對是很關鍵的。如果修法是條太長的路,那針對這兩個法令提出某種程度的執行細則作為要求,或許也是個該優先處理的議題。

    開放政府資料應該以開放政府為發展方向,在這情況下,政府資料的開放在目的上就會很明確,一是透明(與政府資訊公開法互相呼應)另一個是透過資料的開放,讓政府的執行效率效能提昇。例如政府提供的就業輔助資訊,就可透過開放資料的方式釋出後,由民間來彙整加值(與相關培訓課程結合)來協助政府在就業輔導這一塊的政策推動。

    在這情況下,每個部會自己所產出的資料,每一筆都可以是高價值的資料。因為每一筆資料原本就是為了政府的運作而產生,而透過資料開放與釋出,最直接的受益者就是政府部門本身時,各單位機關對資料的釋出就會有不一樣的態度(不是去拼不知道怎麼拼的經濟,或是去找出根本沒人知道的高經濟價值資料)

    在政策修訂的同時,執行上也需要從最基本的做起。所有能開放的資料,首先都會是公開資料(如果連公開都不能,那要談什麼開放?)而目前政府公開的資料(資訊)是由政府資訊公開法來規範。但是這些資訊有哪些。散佈在何處?會不會還有哪些是該公開但是未公開?公開的方式,格式,在網路上的形式為何?我認為,我們目前最需要的不是政府開放資料平台,而是一個將上述資料(資訊)全部整合進來的政府資訊平台。這個平台也該扮演公民提問,要求(例如與個資相關的資訊)的介面。從這出發,我們可以逐步將所有公開資訊依性質與內容做歸類後,整理出無任何授權爭議的開放資料清單,可能會牽扯到第三方授權的,需進一步釐清的資料清單,和最後,受限於其他法令限制(主要應該是個資法)而無法作為開放資料或只能有限度公開的政府資訊(資料)。

    以這為基礎,從政府資訊公開法開始,我們逐步建立台灣政府的資訊平台並將需求慢慢落實到各機關的資訊系統與架構上。這時,我們就可以有一個很清楚可制訂時程的開放資料政策與目標。

    其實,這一切最該被拿出來問的問題是,政府在制訂開放資料政策時,為什麼沒有一個更開放的態度?為什麼不是好好的來詢問在台灣推動開放資料的許多團體組織和專家?為什麼在很多方面還是拿著以往的做事方法來進行?當我們都知道,開放資料是一個連政府自己都陌生的全新概念時,用舊有的方法是要期待產生什麼樣的結果?

    開放資料不該被視為一個產業,工業局與今年執行的案子從基本上就是個錯誤。在舉辦一堆關於開放資料的活動時,到底裡面有多少是真的和開放資料有關係?除了強制要求要使用到目前開放釋出的資料集以外?但是這些資料集,又有多少是原本沒開放時,大家拿不到的,或是很難拿到的?又有多少根本就是普通的資料被包裝一下就拿來當個計畫參加比賽?原因就是開放資料在這些所謂的「創新競賽」中能扮演的角色在目前是非常少非成低的。資料的價值也從來都不在資料本身,而是拿這些資料我們可以做出什麼?甚至,我們該用的資料不會只是政府開放資料,更多會是社群媒體,網路,透過群眾回饋,使用者個人所產出後所得到的資料。而這些才應該是當我們要推動一個產業時想看到的東西。而開放資料,只是這裡面的某個資料來源之一而以。在這情況下,何來的開放資料做為一個產業的政策?

    http://beta.congress.gov/bill/113th-congress/senate-bill/994 - 美國最新通過法案 : Data Act

    Oliver > 各級政府公布格式不統一,讓耙梳資料的困難度上升。(各級地政局用的查詢網頁皆不同)

    tkirby>  舉例來說, 中華民國統計資訊網縣市重要統計指標查詢系統提供了縣市級的統計資訊,而各縣市更細節的資訊則是交由各縣市主計處整理; 看起來各縣市可以統一使用 pxweb 這個系統, 但有不少縣市尚未導入, 仍然以在網站上放出 excel 的形式來做. 其次, 即使導入的這個系統的縣市, 其資料的指標, 單位等等也沒有統一. 以這個例子來說, 如果由中央政府設立統計資訊提供平台, 規劃應有的資料集與其格式, 再由各縣市主動定期更新至這個資料庫, 才能解決這個問題.

    Ronny > 是否能仿造各大學幫 Linux, Debian, Ubuntu, FreeBSD 等 OS mirror 的模式,讓大學也能夠幫政府各部門 open data 做分流,這樣子可以大幅降低放出 giga byte 等級大資料的成本(之前像是商業司完整公司資料、地籍圖資等資料好像都是受限於承包商無技術能力架設分享超大檔案的服務?)

    Passerby>目前政府各級Open Data大都是只有樣版資料,如AED(自動體外電擊器)及氣象(中央氣象局) 二個例子,最後都是要自行去抓特定網站資料處理。都因特別因素,根本沒有真的Open Data。

    如:可開放大學分流 OS mirror模式及社群模式(黑客松),或許還可跳過各級單位外包處理Open Data網站及經費問題。加速Open Data資料完整及可利用性。(2013年詢問過一部份單位,大部份承辦人都還卡在經費和那些可開放等問題。)

  • hychen> 
  • tkirby> 資料 id 的問題其他地方也會有,例如不動產交易實價登錄之記錄亦無提供此類 id,使得在資料更新時較為困難。

    Shih-Chieh Ilya Li>  我建議應該加入「開放研究資料」這個方向作為國家重要發展方向。除了執行業務資料之外,科技部自身更應該有系統地開放接受國家補助之「研究資料」,作為國內資料共享與社會公益使用(如之前的混油問題)、以及規劃國際研究資料共享的架構(如 RDA),加速提升國內研究者的國際競爭力,並且了解在國際科學研究資料共享社群中發展自主能力的迫切問題(例如生物多樣性社群、文化機構典藏的資料引用 data citation 體例與文化的建立)。

    LIWEI Y> 提供目前取得的部分政府Open Data中文欄位列表https://docs.google.com/spreadsheets/d/1cVv9BVsdBtSE9ec6O3o4uLJjZP4vMO8O_vuE_iEFp9E/edit?usp=sharing

    就我所知,有些資料撈是撈的到,但是如果要撈到足夠的資料,有的是需要付費的。如果真是如此,那Open Data還需要付費這件事情,就是值得商議的。

    isacl> 是否考慮使用 CKAN 作為開放資料入口?

    授權模式(含收費與否,因有規費法的限制)合適否?

    "LUCIEN C.H. LIN> 政府資料開放應以不收取費用為原則,因在此前提之下,才能鼓勵並奠定蓬勃發展的基礎,面對當前規費法的限制,建議於規費法第13條第3款下,將原「基於公共利益或特殊需要考量」,規費主管機關得免徵、減徵或停徵應徵收之規費。改為「基於公共利益、政府資訊公開、政府資料開放,或特殊需要考量」,規費主管機關得免徵、減徵或停徵應徵收之規費。以在制定專法或其他更積極舉措推動之前,能適時適份的解決當前規費法對政府資料開放推動的障蔽。

    Dongpo > 規費的課徵應以資料生產成本作為優先考量,因此行政機關於制定開放資料規費時,也應以開放透明的方式說明資料生產成本,基於這樣的成本再制定規費。

    tkirby> 考量公開與不公開時的成本差異與公開的邊際效應. 公開資料會需要額外的成本負擔,但也可能減少其他地方的費用,例如地籍謄本電子化線上申請即減少民眾到現場的交通及時間,亦減少現場窗口人員的人事成本。

    wHisKy > 我們講的開放政府資料中的資料,絕大部分都是為了政府本身的運作而產生,所以這些資料產出的成本,就是每年編列的預算。沒有預算就沒有這些資料。在這情況下,這些資料的開放成本,會依照開放程度(可以是很詳盡的 metadata + 分類 + 完整下載 + API + 即時變動)而有不同。目前看起來不管是架設網站平台或是資料介接與管理,看起來都是額外的成本。但這是因為政府在資料處理這一塊還有太多漏洞,才會出現這些隱性的成本轉為顯性。開放資料與平台的建構只是把目前這些問題突顯出來。

    所以,對於絕大部分的政府資料,照道理說,不管是產出或是開放的成本其實都已經在每年的預算內。在這情況下,是完全沒有理由再依照規費法或是任何法令來再徵收一次費用。

    例外的情況當然有,如即時的動態資訊,需要透過 API 方式介接的。例如台北市公車時刻資訊等。這是一筆耗費不小的成本。但是,如果我們從結果來反推。透過這些資訊的開放,公車時刻資訊的開放,對於群眾使用大眾運輸系統是有非常大的幫助。或許政府就該重新檢討,在這個改變下,目前對聯營公車廠商的補助,是否需要改變或是轉移到資訊開放的基本建設上。這個轉換不是只有金錢換個地方投入,而是從原本的補助,轉為刺激更高的消費行為。從救變成推。造成的影響絕對遠遠大於單純的補助。而

    上面所說的都是政府為了自身運作所產出的資料,同時兼顧到廣大民眾的公益。在這情況下,開放資料絕對是不該收費。如果是該收費的,那或許就該考慮是否符合開放資料的「開放」要點了。但是,在提到開放政府資料時,我們也常常會把另一類非政府本身產出,但是是由政府出資,補助,指定計畫所產出的資料也包含進來。這類資料在目前常常因為版權與授權的問題而無法列為開放資料。從開放資料的方向來看,我們是會希望這些資料有一天也該列為開放資料。而這些資料在成為真正開放資料前,或依照不同的授權規範(例如非商業)釋出時,的確可以有收費的空間。

    關於收費與否,還有一向爭議是關於資料品質的問題。有人會說,目前政府開放資料的品質不佳就是因為免費。收費才能保持一定的品質。這是完全沒有直接關係的聯想。資料的品質除了取決於資料產出者自身的要求,還有一個重點是,越沒人看的資料,就越可能隱藏許多問題。越多人看,使用,關心的資料,品質就會越高。這一切和收費與否,是完全沒有關係。從自由軟體來看就可知道,「免費」的軟體,有時候都會比付費的在質上更佳了!

    因應授權模式,是否又需制定open data相關專法,才得以在我國的open data有更好的發展環境;

    hc>既然已經有資訊公開法,是否直接修法加註 open data 相關規定,要求各單位應以 open data 形式,配合符合公共利益免費使用原則的相關授權規定。  (但我不是法律專業,可能有律師或法律專業人員來研擬比較適合)

    wHisKy > 政府資訊公開法並不適用在開放資料,但是這是一個很好的起點,同時這個法規也需要進一步修改(法務部已經請湯德宗教授做過相關的改善計畫與研究。或許是時候回過來好好檢討為什麼提出建議後卻沒有下文了)。

    政府資訊公開法裡面可以加入一些資訊公開在技術上需特別注意的點 - 例如,盡量不要使用 PDF,尤其是印出又再掃瞄一次的 PDF 檔。盡量使用開放格式。如果是和統計數字,數據表格相關,需提供開放格式的檔案等。也就是,在不違背目前現行的其他法令下,讓資訊的公開能更開放。

    至於開放資料本身,他牽扯到的法令,其實非常多,從著作權法,規費法到檔案法到政府採購法到國科會(科技部)相關提案的法令都會有關係。所以要修法制訂,目前是不實際也會與其他法規起衝突。我會認為,目前當務之急應該是就政府本身產出的資料依照授權做分類清單。並制訂類似 CC 一般的授權標準,先將可清楚確定不會有版權爭議的優先列為開放資料,有爭議的可依照其程度細分,並列出其相關法令與衝突點。最後再依所得到的分類,開始逐項檢討改變。法規的部分可以慢慢依照需求再來來修訂。或許無法馬上就一步登天衝出許多開放資料。但是開放資料本來就是個新的觀念(在台灣,在政府內),所以這些步驟與檢討對話是必須付出的成本。

    開放資料在台灣的發展,我認為目前最大的阻礙是很多東西和觀念對絕大部分的人來說都還是非常不清楚。如果政府認為開放資料是一定要走的路,那就該更積極的與民間團體組織對話,共同探索開放資料在台灣的可能發展方向。

    還有就是,開放政府資料,哪些可開放,哪些不可,就如政府資訊公開法一樣,是會因為其他法令的限制而決定。在這一部分,個資保護與隱私的問題是個需要更積極去處理和釐清的。如果這一部分不說清楚,那台灣的開放資料就永遠無法很清楚的長出一個形狀,永遠都會有一堆爭議需要去處理。法國政府有個專門管理資訊與自由的委員會 (CNIL) 他們才剛剛針對開放資料與個資保護做了一份超過 4000 個回覆的問卷調查。從這可看到法國對這個問題的重視。

    我們不需要在現階段特別制訂相關法案,但是一些原本的法案該思考如何去修改,由行政院直接提出法案修訂版本後交由立法院討論通過。

    彭啟明博士> 我在多次會議建議要提出資料開放法,目前許多地方都有類似法令,但台灣現有政治環境實在太慢了,要拖上兩年以上。

    再講到發展環境,國外有些案例是由總理發布後、地方政府配合施行,而非像我國僅自中央政府制定後慢慢實施;有關這點,g0v的看法為何?

    彭啟明博士> 由上到下,和由下到上都需要,但如果各國都是由領導人出面宣示,變成本身的執行政策,甚至設置專業人員來解決一些問題,我們就必須好好思考原因了。

      

    Shih-Chieh Ilya Li>  以美國為例。美國白宮 OSTP(科學、科技與政策辦公室)各項計畫首頁中,其中一項工作就是明定「推廣開放資料、開放科學與開放政府」(Promoting Open Data, Open Science, and Open Government。在本人歷次參與的科學資料共享的會議中,OSTP 除了有派人參加,並且在 NAS 美國國家科學院主辦的RDA 第二次大會中,由 Tom Kalil(Deputy Director for Technology and Innovation, White House Office of Science and Technology Policy)發表專題演講宣示其具體作法。(中央政府核心的支持之重要性)

    tkirby> 目前有很多資料都是各地方政府自己放出來,優點是資料更新效率較高,但幾乎都會碰到資料不統一的問題,使得說要做全國性資料應用的時候困難重重。我認為中央政府有必要定義清楚資料釋出的格式,但這並不限制地方政府釋出資料的範圍. 也許可以是先由法令讓各地方政府釋出資料,再由中央政府逐漸將各地方政府釋出的資料統一起來

    whisky > 國外更多範例是地方政府跑在中央前面,然後中央才開始慢慢追上來。我不認為問題是在該由誰發佈誰來追隨,誰來配合,而是這裡面中央,地方,全國在開放資料從政策到溝通是如何在進行的?例如我們知道雙北因為地緣關係彼此有很密切的合作關係。所以他們在開放資料的推動上,兩邊都可互相拉拔成長。這樣的關係,在目前的中央政府內(中央各部會),在中央與地方之間又是如何?因為有很多標準的確可以由中央制訂(資料交換標準, metadata制訂標準),但是不表示地方就會跟著做。同時目前的作法比較偏向,各自解決各自要面對的問題。所以國發會這邊會制訂規格,制訂作業原則等執行上的細則。然後各部會自己去思考可以把什麼資料拿出來,是否要制訂自己的開放資料平台等。這其實就是政府目前的標準作業方式,一邊有 IT人負責基礎架構,另一邊有業務單位負責資料收集和輸入。而兩邊要面對要處理的問題可能都不太一樣。然後一遇到問題,就是直接丟回給國發會處理。所以國發會在這裡面可能每天就是要處理這些不同資料集之間的各種問題。

    我國open data發展應可將推動經驗複製到東南亞國家,g0v認為可如何進行?

    彭啟明博士> 東南亞國家發展很快,我覺得依照目前台灣的瓶頸,我們不要說大話比較好,把資料集拉到一萬個以上,特別是關鍵資料可以開放再來說這句話。

    pofeng> 或許說是推動經驗交流就好了  (不要講複製)

    pofeng>  地區國家可先找香港/越南/印度/菲律賓,NGO 建議找 gnome.asia 或 ,因為 coscup 的緣故,與這國家與組織有聯繫,如果有當地的 open source 社群支持,配合官方對官方的經驗分享,社群對社群的經驗分享,感覺比較有機會弄起來 ... Open Knowledge Foundation 也可考慮, 但 .... 

    sakana> 如同 pefeng 所說可以結合 GNOME.Asia 相關的社群, 今年香港的 open source HK 年會就有開始討論相關議題, 結合國家/地區的社群, 搭配研討會或是社群活動可以創造議題以及增進交流, 期望由不同的國家以及地區觸發出不同的應用以及議題來活用及增進 open data 發展.  

    muyueh> 一些公眾服務所產生的資料,其資料是否也應屬於開放資料的範圍內?比方悠遊卡。

    犯罪地點、車禍事故等資料,是否可以在顧及隱私權的情況下,開放供大眾使用分析?(現在連分析界面都已經做好了,只待開放資料:http://muyueh.com/30/traffic/xinzhu.html

    為什麼 YouBike 的資料需要簽約才可以取得?http://www.dot.taipei.gov.tw/ct.asp?xItem=3167481&CtNode=44829&mp=117001

    muyueh>非營利組織列表/內政部、教育部:http://cois.moi.gov.tw/moiweb/web/frmHome.aspx 沒有此資料,如何判斷某團體是否為非營利組織?

    。非營利組織年度財務報告/內政部:聯合勸募所估計台灣每年捐款金額為 654 億元,非盈利組織每年會提交一份財務報告給其主管機關,目前此財務報告並未公開

    。非營利組織,司法院已有公開供民眾查詢的資料,但並未整合進政府的Open Data網站中。 ( http://cdcb.judicial.gov.tw/abbs/wkw/WHD6K00.jsp

    。綜合所得稅捐款扣除額/內政部:為台灣 2008 年綜合所得稅的捐款扣除額為 369 億元,約佔其 1% 沒有辦法檢視其流向

    。台灣歷史溫度、雨量資料/中央氣象局:瞭解台灣的暖化問題:氣象局有做過百年來溫度變化的統計(每三十年上升一度 ),但其歷史資料溫度並無公開。http://web1.nsc.gov.tw/public/Data/8491018329.pdf

    Shih-Chieh Ilya Li> 國際經驗的推廣交流民間已經在進行,如果是鼓勵民間持續進行,那麼可以投入資源在此方向。然而政府等級的作為必須要考量到目標為何,長期投入抑或短期煙火。建議在這種「推廣計畫」進行之前,先舉辦戰略/策略會議釐清透過 open data 所連動的、對內部國家各部門、各機構之戰略/策略意義(並擇之深化)。

    與會名單

    對談人員:Kirby Wu、jimmy huang、 Muyueh Lee

    直播人員:-影音  -文字

    > 此座談會謝絕媒體採訪,是否透過轉播讓公開資料座談會真正的「公開」

    我整理一下IRC上的討論給關心這場會議的朋友們。from IRC log

    前言:

    5/02的會議科技部定義為內部會議,而非座談,因此科技部不開放媒體記者參與。

    Q: 是否允許g0v參與者自己的 影音及文字 的 直播/紀錄 ?

    A: 與會者做紀錄應該可以,但是目前沒有直播的安排。

       與會者人員經由事先跟對方確認過了,而我們3位6隻手,我猜是夠來做一些紀錄。過往方式是會議做簡記,而會後再整理一下內容釋出。