3 月萌典松: moed9ct
時間:3/28 11am-9pm(歡迎遲到早退)
地點:Bookshow.tw 基隆路一段 141 號 6 樓之 7(捷運市政府站步行三分鐘)
名額:35 人(報名頁面)
內容:比照前八次萌典松 ,採「併松」模式舉行,歡迎 g0v 各大小專案加萌參加。
費用:採量力而捐、自由贊助方式。如有剩餘,捐給下次黑客松。
活動守則:https://g0v.io/coc
直播網址:https://www.youtube.com/watch?v=_YLKZFLuBfs
註:今天聯合黑客松的 第二次新聞松 實況轉播網址/https://www.youtube.com/watch?v=vQd0gicscKM
流程:
- 11:30 專案、想法簡報介紹
- 12:00 自介、午餐、分組意見交流
- 13:30 十五分鐘短講
- 14:30 hack, eat, hack
- 17:00 第一次成果報告
- 17:30 hack, eat, hack
- 19:30 第二次成果報告
萌典相關開發項目
- 新臺語運動
- 坑主報名時已額滿,所以排了其他事情,陷入後來有票也難以回頭的窘境。文字報告如下:
- 專案目的:做一個給鄉民用的學台語、查台語網站,前端讓大家好用好查,背後由具正規化台語文書寫能力團隊維護。
- hackpad: https://g0v.hackpad.com/moed7ct-taigi-neologism?r=0#
- moqup:https://moqups.com/liz462/IMYHBVi5
- github:https://github.com/g0v/taigi-neologism
- 目前進度:前端雛形已由pomin5完成,並於不得罷免黑客松報告;後端目前薛丞宏一邊服役一邊寫。
- 下一步:前後端大約完成後:
- 第一階段會請具台語文能力的團隊測試、補資料;
- 第二階段請鄉民盡量發問、盡量幫忙回答,以充實資料庫並改善網站;
- 第三階段想辦法宣傳及推廣。
- 阿美語萌典
- 討論上述兩個專案在牛津寰語計畫的介紹方式
- 這是 OUP 想彙集各地 crowd dictionary 的工作一覽,所以主要是看看九月時怎麼介紹,例如把專案名稱和簡介翻成英語之類的。
- 吳守禮《國臺對照活用辭典》資料處理資源蒐集
- Photo & PDF: http://olddoc.tmu.edu.tw/chiaushin/dic-2.htm
- 用字彙編及字型: http://xiaoxue.iis.sinica.edu.tw/download/WSL_TPS_Huibian.htm
- 阿石工作區: https://github.com/g0v/koktai/tree/master/a-tsioh_sandbox
- 倚天印表機控制碼表: https://tw.knowledge.yahoo.com/question/question?qid=1205072104611
- 倚天使用手冊第六章印表控制 掃描圖檔 http://kcwu.csie.org/~kcwu/tmp/eten-ch6-print.zip
- 目前 a-tsioh 工作狀態預覽 https://g0v.github.io/koktai/
- yapcheahshen 提供 https://github.com/g0v/koktai/tree/master/big5-mapping
- 國家教育研究院教材編制、雙語詞彙、索引典、分詞系統討論。會有三位國教院的朋友加入:
- 柯華葳 院長
- 王立心 主任 (綜合規劃室)
- 邵婉卿 助理研究員 (編譯發展中心)
- 大BKRC 中俄/俄中字典: http://bkrs.info
- https://github.com/ukoloff/bkrs
*
- https://itunes.apple.com/ru/app/e-han-ci-dian-russko-kitajskij/id598999128?mt=8
- moedict.tw 是非營利、完全開放程式碼的詞典網站,目前已有中德/法/英翻譯。如果想要使用,想請問是否有公眾授權條款(如 Creative Commons),或是希望如何標示來源(如網址、連結等)
- Kage Font Generator
- IDS 直接生成 SVG 的 React Component 部件
- 參考資料:部件檢索辭典 http://blog.xuite.net/fg_wang/twblog/309627490
- https://github.com/ksanaforge/kzy Font Generator 使用 http://fonts.jp/kage/ ,但目前只能喂 Glyphwiki 格式( 部件代碼及字框)。
- TODO 1: 從IDS算出適當的字框,即可完全取代醜醜的剎那單線體。
- Prior art: 丞宏的 han3_ji7_tsoo1_kian3 (漢字組建專案)
- https://github.com/g0v/idskage demo 從IDS產生kage 的輸入格式
- TODO 2: Web 版、中文介面的字框調整程式。自由上傳缺字的IDS及字框參數。server side 儲存IDS及比例參數,缺字以IDS交換及搜尋,client side 如果 render之前找不到字框參數,則自動以idskage產生。
- 請問 IDS 是什麼? 好像沒有給參考網址
- http://en.wikipedia.org/wiki/Chinese_character_description_languages
- kage online demo http://fonts.jp/kage/demo.html
- https://github.com/ksanaforge/kzy/blob/master/components/kzy-glyphwiki/gen.js 這段程式抓glyphwiki 的dump,轉換成 json。
- dump 裡面一個字大概長這樣:
- u26c29 | u26c29 | 99:0:0:0:3:200:162:u8279-03$1:12:13:44:63:44:92$1:2:2:44:63:156:63$1:22:23:156:63:156:92$1:2:2:44:92:156:92$1:0:0:30:114:170:114$1:0:0:18:137:182:137$7:32:7:100ː63:100ː110:100ː175:14:185$2:7:0:104:137:126:170:175:179
- 99:0:0:0:3:200:162:u8279-03
- 1:12:13:44:63:44:92
- 1:2:2:44:63:156:63
- 1:22:23:156:63:156:92
- 1:2:2:44:92:156:92
- 1:0:0:30:114:170:114
- 1:0:0:18:137:182:137
- 7:32:7:100ː63:100ː110:100ː175:14:185
- 2:7:0:104:137:126:170:175:179
- 99 開頭表示引用別的字,以「99:0:0:0:3:200:162:u8279-03」為例,格式:開頭兩個0,0用途未知,0,3為左上角x,y座標,200,162為右下角x,y座標。最後u8279-03為部件id (艹的第03號異體)。
- client side 可以從這個資料找到可以讓使用者微調的部件。
- 非99開頭是筆劃類型及參數點,直接送給kage就好。
短講
併松
超農域
http://hack.g0v.tw/agriculture
公有地大行動
idea pool: 妄想土地/自己的土地自己用
陽光/開放政商/關係松
Sunlighthon / GuanXithon
http://beta.hackfoldr.org/gxv/
ppt 政治承諾追蹤網
Political Promise Tracker
東海大學企管系EMBA碩士論文提案
EMBA
藏傳大藏經 on GitHub
https://github.com/karmapa/adarsha2014
發表會新聞稿(英文) 中文 影片(西藏語)
國民小學國語數位教科書提案
- Google Drive: http://goo.gl/jcrO6Z
- ePub3 on Android: GitDen reader、on iOS/OS X: iBooks、on PC: Readium@Chrome
- Tested with: http://goo.gl/TdLZ8J
- ePub3 Export test: https://isp.moe.edu.tw/resources/resources_festival_list.jsp
- 目前似乎無法生成 ePub3
- 由 NAER 與維護者連絡,看是否能把 react-odp 接上去
- 部件拆分原則:
- 以不重疊的部件為準
- 拆出來的單部件都要是國字(難字如「舛」是 OK 的)
- 筆順以整字為主,拆出來之後不需要筆順
- 同義字
- 放在 notes 裡
- 句型用 CKIP 的樹(不顯示給使用者),Nhaa Nab 可置換,其他 particle 保留
- 仿作
- 數位教科書可以做 parse tree
- 學生自己寫時,給出 parse tree 裡不同的部份
- 如果都一樣則視為照樣造句成功
- 不然,以紅色標示不同處,但不判定為錯誤與否
- 量詞
- 用 http://120.127.233.228/Concordancer/ 選 Nf,找最近的名詞(Nab),做成文字雲
- Family resemblance, 不再取 ontological abstraction
- 疊詞
- 萌典 regex 搜尋:
- (.)\\1(.)\\2
- (.)(.)\\1\\2
- 狀聲詞
- 用 https://www.moedict.tw/?q="的聲音" 來找。
- 自動出題,由老師篩選 false negatives
- 詢問「教育部數位教學資源入口網」(isp.moe.edu.tw/)有關「將勾選項目轉製成電子書」的功能。網站管理員回應:目前教育ISP僅提供資源轉製為電子書目錄,並無提供將各別資源內容轉成互動式瀏覽電子書服務。
- 規劃將完成的電子書公開於教育部的「教育雲」(cloud.edu.tw)及國家教育研究院網站。
- 標準上需要注意,IDPF與W3C以及IMS正在製作EDUPUB規範。製作教科書時,盡量希望能與國際標準接軌。這裏提供一些資料:
- What is EDUPUB(PPTX by Markus Gylling, IDPF CTO)
- EPUB 3 EDUPUB Profile
- EPUB Scriptable Components Packaging and Integration 1.0
- 另外注音符號在Web上的呈現最近有些擱淺,是否能給予協助?(Test Cases)
- 暫時完成「讀學悠遊第1單元_動物昆蟲篇12課」Libre Office Impress ODP格式檔(2015.05.23),在Google Drive: https://goo.gl/Xrdr0o
MOEDICT 引用書目分析
該書被引用次數越多,泡泡越大。
Online Demo(d3.js) Github
- 萌典如果包含常用引用書目的內容,從義項點引文,可跳到原文。
- 只要有了以下的書,超過50%的引文可快速點看原文的上下文:文選,紅樓夢,三國演義,儒林外史,初刻拍案驚奇,漢書,史記,後漢書,文明小史,西遊記,詩經,水滸傳,左傳,晉書,禮記,三國志,說文解字,金瓶梅,書經,新唐書,老殘遊記,孟子,兒女英雄傳,宋史,聊齋志異,莊子,論語,楚辭,醒世恆言,喻世明言,淮南子
- 考慮超連結/引入:
- ctext.org
- 古騰堡計畫
- https://github.com/ksanaforge/openlit (開放文學)
- wikisource, of course
- 癡心妄想:把這些書做成EPUB,以Readium JS Host在Web上,透過EPUB CFI來定址,實踐一點EPUBWEB的可能。
部件拼字遊戲 (中文scrabble)
- 延伸萌典部件方塊的想法,但不是即時的
- 多人線上遊戲。
- 系統隨機給出5~8個部件,高頻部件分數低,罕用部件分數高。
- 玩家試圖用這些部件,組出最多的字,部件可重覆使用。
- 組成部件的分數加總即為該字分數。
- 即時顯示每位玩家目前成功組出的字數,以增加刺激感。
- 在限定時間內,總分最高者勝利。
- 可限定字集,如小國生常用字,中日韓 800共用漢字等。
- 為防止使用者用亂猜的方法,系統用某些方式(詢問字音或字義)來確認,答錯者扣秒數。
- FB 登入,記錄成績,頒發漢字能力檢定證書。
例:以「木」「口」,可組出「㕲㗊吅吕呆品啉喿噪杏林森楍榀槑橾」。
從部件產生可能的字,程式碼及講解。
授權小幫手
g0v開放社群授權小幫手,現有的方案不夠直覺,希望能做成更簡單的精靈
目標使用者 : 幫助設計師快速找到適合的授權方式!
https://g0v.hackpad.com/Cp3CFHqbLcx
場務
午餐統計:素食 x3 葷食 x29
漂書 / DVD
《這不是太陽花學運》
- 作者之一羅慧雯因參考、引用 g0v 社群產出( hackpad 媒體採訪共筆、g0v.tw/about、零時政府的第一年、向日葵體驗營⋯⋯等),贈書給社群致謝,托 venev 轉交,歡迎自由取閱
《選舉追緝令 1998 / BULWORTH》
- 台北市長選舉期間,simon(還是誰)提到選舉文化跟這部電影有 deja vu 感,推薦觀賞
- nchild 千方百計(?)買到 DVD -> 傳給 BP venev 看完 -> 歡迎接手繼續看
- warning: 不是 A 級大製作,影片諧謔風格靠北