二月第⒁次萌典松 moed14ct
時間:2/20 11am-8:00pm(歡迎遲到早退)
地點:信義區忠孝東路五段293號3樓(兩倍大的 Bookshow 2.0)
名額:40 人(報名頁面)
內容:比照之前萌典松,採「併松」模式舉行,歡迎 g0v 各大小專案加「萌」參加。
費用:採量力而捐、自由贊助方式。如有剩餘,捐給下次黑客松。
A-Han Lin請問午餐與點心有人贊助了嗎?維基協會希望可以贊助喔!\\(^o^)/
活動守則:https://g0v.io/coc
直播:http://youtu.be/7K-_Tl-ba_k
萌典相關開發項目
- 徐兆泉「天光」客語詞典
- iTaigi.tw 專案:http://itaigi.tw/
- 繼續寫code
- iTaigi FB 求一個底圖
- 超農域
- 文本分析器
- (新聞松這邊提出的分析人類文字的方法/用魚骨圖分類新聞稿,看出社會事件枝枝節節/)
有人有興趣做剛出爐的「原住民族語言線上詞典」嗎~~http://e-dictionary.apc.gov.tw/Index.htm
併松
歡迎把想做的專案/計畫列在這裡!
* (台南地震災害,八仙塵爆)NewsDeff的存檔 轉成 txt文本 暨 文本分析器設計
- 需要:程式工程師
- 把 json 格式檔案轉出來文字檔,讓文書人員可以利用,以及分析。
- 下午的短講『介紹什麼是「文本分析器」』,會加強解釋預計的用法。
- 文本分析器 — Michael_LI
- Newsdiff 轉檔成可以定標籤的編輯界面
招募到一位程式是工程師,一位可以協助製作節目的人。
* 台語松:coding iTaigi coding講台語:這次希望有完整的時間大家用台語聊天
* 自己的Emoji自己造繼續(需要繪圖協助!
- OpenGLAM Benchmark Survey 台灣研究 — shangkuanlc 上官良治
- Translation QC
- 需要:
- 校訂翻譯
- 建議可填寫的人
- 參考連結
- 校訂翻譯:
- 英文版本(google文件)(pdf版本)
- 中文譯稿
- 校對提問
- 名單:
- 台灣文化典藏機構列表 (請補)
- 視音漢字 — stwcsigma 陳文豊
- 自動圖文集功能求助
- Maybe relevant: http://extensions.libreoffice.org/extension-center/typography-toolbar
- 目前等待上游回應中 YuriyGuts/unicode virtual keyboard#2

- 造字、使用簡報上傳
- iTaigi.tw — liz 林佳怡
- 序大圖(長輩圖)底圖美術設計
- YouTube 連結
- 用台語邊聊天邊寫程式
- koktai — a-tsioh 馬基石(阿石)
- 維基文庫吳守禮國台辭典開放 — A-Han(阿翰)
- 維基文庫匯入,感謝Alex協力將python轉換維Wiki語法。
- 缺字部份:https://ethercalc.org/koktai-ids.html
- (CSV 亦可) filter C 欄是空的部份即為未對應之造字
- 缺字:目前約三百多字缺字需造字,感謝意傳協助組字系統完成約290多字。餘下無法組字則以圖檔顯示。
- 部分指示代詞目前申請unicode字碼日後使用,如「只个」(遮的)
- 「只个」→source/compare→exist
- →other lange
現在的unicode有定碼我們可以用,不然就是用ids組字
至於ids<->unicode已經定碼的字,有對照表就可對應,為技術可解決之問題
同意,採用目前方案即可。
吳守禮先生台語正字資料參考,由A-Han取得後再轉交Bobby
- 附錄部分缺字需掃描,如小篆字。由A-Han掃描後,等上傳至文庫完畢後再加入。
- 寫啥物 — sih4sing5hong5 薛丞宏
- 專案:http://docs.tai5uan5gian5gi2hok8bu7.apiary.io/#
- 翻譯、語音合成回報
- 需要一個新名字(?)
- 前端界面
- 如何有效率得到語料
- 在網頁文字上附聲音:http://gaga978.github.io/gongdaigi/
可以詢問組字的網站網址嗎?
- Object-oriented 台語翻譯 = 物件朝向 —
- 加入 iTaigi.tw 語料庫
感謝, 勞力
- 司法院判決書 — Billy 林雨蒼
- 轉 HTML 檔,接搜尋引擎
- moedict.el — kuanyui (ono hiroko)
- Vector -> rasterization
- ASCII art library written in Emacs Lisp
- 沒做完,複習國高中數學中orz
- 引得市 — 阿良
- 改進搜尋界面呈現方式
- 部件檢索器 Ext-E 輸入界面
- 古文字缺字輸入法
不曉得所謂因為著作權而不能公開指的是什麼?
不能公開的部分是指原書籍的頁面。如果有些文獻比較古,或許在新界面中可以開放顯示。
書的完整內文批次下載
之前有計劃將我爺爺書數位化,不曉得是否有幫助,可以參考範例頁。
今天有帶掃書機來,在後面工作檯上 XD
書沒有帶,古代的書寫方式掃了會變成圖,無法文字辨識喔!
先掃成 600dpi 再說... 這是一個坑(毛筆 OCR)
範例頁可能只有 72dpi 這真的沒辦法
大坑啊!(只會以類持刷方式握筆)
是啊!只是給看一下內容大致是這樣。
掃書機是 AU 的嗎?我之後可以把書送去你指定地點。
是的,好啊,DS-510 http://24h.pchome.com.tw/prod/DCAE0S-A81240449
今天看到機器,真是大開眼界!
絕版書誒 要拆書就太超過了
我之前有找到教育部異體字字典的光碟,我有留iso:https://www.dropbox.com/sh/gyd48nvukitt84t/AADeUJgxmHID0lEzTmBOoEl5a?dl=0
- 鄉民風水師
- 忘記帶 MicroUSB 線 XD
- 吉凶畫面設計
- ksana 的 codemirror-kage

這個結構!是 λ ! yap 說長度跟用 IDS 一樣,但是沒有構字符號了!
短講
* 介紹什麼是「文本分析器」。(新聞松子計畫:節目「問題來了」)
主講人:Michael_LI
投影片(.odp 開放文書格式,請下載之後再開啟)
失物招領
- MacBook 小白豆腐充電器(在最靠近導播台的柚木桌上發現的)
- 上班時間聯絡 Bookshow 02-27639627
- 45W 的嗎?應該是我的 XD