iTaigi愛台語 新台語‧運動

最後編輯:2017-05-28 建立:2014-11-22 歷史紀錄
nan

 

    LIZ L重要彙整

 

 

 

    薛丞宏20170325萌典松

  • 薛丞宏討論加例句,介面 https://g0v-tw.slack.com/archives/C0N9DK6JU/p1490166302950339
    • 格式
      • 文章
    • 加的來源:
      • itaigi提供
        • 準做有例句團隊,有人加入時,無法度看啥物人會當加入
      • 使用者提供一句
      • 去fb掠發文,然後自己選要分享什麼文章
        • 用hasgtag 揀
    • 正規化的方法
      • 正規化團隊
      • 提供者自己正規化,程式輔助 (台華對應語句: 700字表 & 對齊外語語句)
      • 類似wiki,大家可以即時改、可以回復歷史
      • 蔡文莉維基主題句,訂目標:專攻某個主題
        • 薛丞宏討論某些
        • 好處:這波做完,有明顯的里呈碑,可以release,有行銷效果
        • 類似台語松,
    • 需要正規化的狀況
      • 漢字/音標拍毋著(呷飯)
        • 簡單
      • 斷詞斷毋著(食飯→食-飯)
      • 用法用毋著(找錢→揣錢)
        • 這是按呢嗎?
          • 袂使用「嗎」
          • 有價值判斷,改例句會ta著人的線
    • 加的介面:
    • 流程
      • itaigi團隊-朗讀稿 / fb文章 輸入
      • 自動補漢字/臺羅
      • 正規化團隊閣巡,巡了囥入去例句
        • 逗點不斷句,句驚疑斷
        • 好的勾起來,bai2的莫閣改,直接莫用
        • 音標會當用括號提掉

 

  • 詞條的討論和fb粉專結合 g0v/itaigi#339
  • safari需要支援http content-range的後端 g0v/itaigi#338
    • nginx cache後無法回應206 parital content

 

 

 

 

  • SIMON X台語搭配詞產生器
  • LIZ L徵求粉專共同管理者

 

可以直接看前面的大松列表^^"

 

 

LIZ L網站說明:http://itaigi.tw/about

HANK W大松討論:

  • 網站首頁顯示熱門新聞關鍵詞講法
  • 單字學習網站(文章單詞即時翻譯):http://readlang.com/

LIZ L推薦issue(執行完畢請打勾):

  • FB粉專使用的logo圖片,修改為600*315,並在 "itaigi" 右邊加上 ".tw" (github issue #248)
  • 查詢結果卡片排列之後,目前是全橫版「閣會使按呢講,我來做伙添」→討論→相關詞,要修改為「閣會使按呢講,我來做伙添」設計成一張卡片,放在所有說法的最後面→「相關詞」接著出現→最後才是討論功能 (github issue #247)
  • 本來已經在"我很會"裡面等待講法的詞,如果又再次被按了"求講法",就把這個詞移到我很會列表中前面去 (github issue #24)
    Hank Wuchairco處理中
  • 首頁熱門詞是寫死的,要修改為最新貢獻的詞,但作法尚未確定,大家討論覺得好就可以做 (github issue #259)
  • 主題詞條呈現方式:之後會想要推出主題式詞條瀏覽,例如寶可夢台語全系列、台語台灣史重要詞彙等等,希望在首頁有一個icon,連結到獨立頁面,呈現該主題所有詞條。(github issue #210)
    • HUI-CHIEH S台灣史詞彙:重大事件斷點/斷代
      • 1624-1662 荷治時期
        • ELLEN P南島語系
        • 平埔族
        • 羅漢腳
        • 有唐山公,無唐山媽
        • 轉口站
        • 剝削式
        • 殖民統治
        • 大員(台員,台窩灣)->台灣
        • 熱蘭遮城->安平古堡
      • HUI-CHIEH S16、17世紀-1732 大肚王國
        • ELLEN P新港文書
        • 我手寫我口
        • 番仔契
        • 教冊
        • 鵝毛管筆
      • HUI-CHIEH S1652 郭懷一事件
        • ELLEN P閩南人受雇移民
        • 稻米甘蔗
        • 稅賦繁重
      • HUI-CHIEH S1662-1683 明鄭時期/東寧王國
        • ELLEN P台灣的國王
        • 武裝化的私人海商集團
        • 通洋之利
        • 開墾地名包含 營 鎮 勁 協
      • HUI-CHIEH S1683-1895 清治時期
        • ELLEN P有應公廟
        • 黑水溝
        • 唐山過台灣,心肝結歸丸
        • 分類械鬥
        • 台灣人放尿攪沙勿會結堆
        • 身分認同
        • 原鄉認同
        • 隘門
        • 防禦工事
        • 金門不認同安 台灣不認唐山
        • 仙拚仙,判死猴齊天
        • 墾戶制
        • 大小租制
        • 集資合股開發土地=>股 分 份
        • 墾號 陳賴章 金廣福
        • 熟番 歸化生番 生番
        • 設社學 改風俗 賜姓名
        • 一府二鹿三艋舺
        • 同業公會的郊=>布郊 糖郊
        • 貿易船運業的郊=>泉郊 廈郊
        • 糖茶樟腦油出口至歐美日中國澳洲
        • 樟腦油佔世界總產量70%以上
        • 長足 批館=>郵政
        • 蒸汽機車 騰雲一號
        • 電燈自來水醫院
        • 劉銘傳
        • 台灣民主國
      • HUI-CHIEH S1721 朱一貴事件
        • ELLEN P吏治之壞
        • 稅賦之重
        • 一隻牛剝兩層皮
        • 歃血為盟
        • 結拜兄弟
        • 鴨母王
        • 三年一小反 五年一大亂
      • HUI-CHIEH S1787-1788 林爽文事件
        • ELLEN P帝王迷夢
        • 義民
      • 1860 開滬尾港後
        • 基督教
        • 台灣府城教會報
        • 長老教會中學
        • 牛津學堂
        • 滬尾偕醫館
        • 淡水女學堂
      • HUI-CHIEH S1862-1865 戴潮春事件
      • 1895-1945 日治時期
        • ELLEN P牡丹社事件
        • 自來水道
        • 縱貫鐵路登山鐵道
        • 水力發電所
        • 初等教育普及率71.3%
        • 司法警察戶政農會
        • 金融財經農田水利
        • 公路電力
        • 台灣報紙 台灣青年 台灣 台灣民報 台灣新民報
      • HUI-CHIEH S1907 北埔事件
      • 1915 西來庵事件(噍吧哖事件)
      • 1921- 台灣文化協會
        • ELLEN P讀報社
        • 電影巡迴隊(美台團)
        • 啟蒙活動名家課程
      • HUI-CHIEH S1921-1934 台灣議會設置請願運動
        • ELLEN P台灣農民組合1926
      • HUI-CHIEH S1927 台灣民眾黨成立
      • 1928 台灣共產黨成立
      • 1930 霧社事件
        • ELLEN P武裝抗日
      • 1935 選舉地方議員 第一次有限制條件的選舉與被選舉
      • 1937 皇民化運動
      • HUI-CHIEH S1939-1945 二次世界大戰
        • 1941-1945 太平洋戰爭
        • ELLEN P募兵 徵兵
        • HUI-CHIEH S1945 台北空襲
      • 1945 國民政府接收台灣
        • ELLEN P家族政治
        • 貪汙腐敗
        • 統制經濟
        • 哄抬物價
        • 外行領導內行
        • 民不聊生
        • 失業人口
      • HUI-CHIEH S1947 二二八事件
        • ELLEN P劣幣驅逐良幣
        • 黑金政治
        • 社會菁英屠殺殆盡
        • 惡性通貨膨脹
        • 四萬元換一元
        • 一日三市
      • HUI-CHIEH S1948-1992 萬年國會
        • ELLEN P動員戡亂時期臨時條款
        • 三七五減租
        • 公地放領
        • 耕者有其田
        • 反共抗俄
        • 漢賊不兩立
      • HUI-CHIEH S1949-1987 戒嚴/解嚴
        • 1949 澎湖713事件
        • 白色恐怖
        • ELLEN P特務政治
        • 肅清匪諜
      • HUI-CHIEH S1949 自由中國雜誌創刊
        • 1960 雷震案
        • ELLEN P五龍一鳳
        • 中國民主黨
      • 1951-1965 美國金援15億美金
        • 經濟安定委員會
        • 勞力密集
        • 外貿導向
        • 紡織 食品加工 合板 肥料
      • HUI-CHIEH S1958 八二三砲戰
        • ELLEN P聯合公報
        • 單日打雙日不打
      • 1971 聯合國二七五八決議,中華民國由P.R.C.繼承
      • HUI-CHIEH S1977 中壢事件
      • 1977-1978 鄉土文學論戰
      • 1979 美麗島事件
      • ELLEN P1979 中美建交台美斷交 台灣關係法
      • HUI-CHIEH S1984 自由時代週刊創刊
      • 1986 民主進步黨成立
      • 1988 520農民運動
      • 1990 野百合學運
      • 1991 國會全面改選
      • 1996 總統民選
      • 2000 政黨輪替
      • 2002 台灣加入WTO
      • 2006 紅衫軍反扁運動
      • 2008 野草莓學運
      • 2013 白衫軍運動
        • 廢除非戰時的軍事審判制度
      • 2014 太陽花學運
    • HANK W臺灣bar影片台語版
  • LIZ L貢獻講法貢獻講法貢獻講法貢獻講法貢獻講法貢獻講法貢獻講法貢獻講法貢獻講法

 

HUI-CHIEH SiTaigi

 

  • LIZ L網站優化組
  • 分享的畫面(九宮格?) Abbygail ET Wu 來認領囉 (open graph)
    • Liz LinYA~~~
      Liz Lin好像好了等更新
  • logo修改成適合FB分享:600*315,並加上.tw,要適合原本的設計
  • 名人堂(貢獻及正規化)
  • 錯誤回報的功能
  • 正規化表格如何更好用?黑洞問題怎麼處理?
  • 莊銘彥「怎麼講」再次被問,移到最上面
  • webfont (issue#144)
  • AUDREY T重複資料合併

 

  • 內容充實及宣傳組
  • 主題詞條列表的頁面和流程設計:比如寶可夢所有怪獸在同一頁呈現,未來可以發展各種主題→有初步介面下次可以做
  • 新的熱門詞(這是寫死的,今天換五個,歡迎提供):小屁孩、秀下限、白海豚、躺著也中槍
  • 我很會詞條整理 http://db.itaigi.tw/管理/隱藏項目 要先從網站點登入之後再回來這個網頁登入
  • 我很會說法發想
  • FB徵求共同經營者:分享詞彙
  • 其他宣傳活動及充實方案推坑出去(目前待做的專案「臺語台灣史」)
  • 除網頁操作外要寫一個感性(???)文案
  • SIMON X國台語翻譯API、搭配詞典

 

 

 

LIZ L待進行的工作

  • 我很會 拉bar 或其他設計
  • 貢獻者錄音功能完成(檔案要放哪裡?) 錄音功能先暫緩做
  • 進入正規化表格的歷程修正
  • 校訂後語音合成功能,並連上該詞條
  • 首頁圖片和影片連結接上去:首頁圖片先固定用CC那張,連到粉專
  • 楊資料庫中漢字無問題的待匯入
  • 其他issue
  • 好工具的內容
  • 求講法功能還沒好
  • 想貢獻可以不用登入
  • 討論區

 

不會coding區

  • 製作關於本站:網站公測使用說明
  • 規劃宣傳公測
  • 無痛學臺羅教材製作
  • 臺語笑點
    johnny好工具再麻煩提供,例如輸入法等等
    johnny右上 twitter 是某有需要
    johnny是否需要加個關於本站,可以寫一些為什麼除了官方字典外我們還需要這樣做等等

 

當日紀錄

簡報

首頁建議詞條:寶可夢、討厭、水母、手腳不乾淨、煩

 

 

    LIZ L大松紀錄前移 20160618 19th

  • 首頁新設計(等前端工程師來做) @wenja
  • 前端提供講法,進入正規化表格,應該要等到正規畫團隊簽名之後(j欄),前端才可以被查到(抓FGH欄),但目前是直接抓原始資料(CDE欄),待修正 @hychen

 

 

    LIZ L加入正規化團隊

LIZ L粉專私訊要加入正規化團隊的回覆:

只要對教育部台語漢字及台羅拼音非常熟悉,就可以加入正規化團隊幫忙改字校對,校對工作在google sheet上進行,請給我們你的gmail帳號就可以。

 

在加入該帳號時會同時給以下這段說明:

正規化團隊工作說明:

1.表格中的原華語、原漢字、原拼音,是使用者提供。我們要在正確華語、正規漢字、台羅三欄位進行正規化校對。華語的部分除非是使用者真的寫錯字,否則我們盡量不改;台語漢字務必使用教育部推薦漢字,教育部未收漢字可使用台日大辭典;臺羅請使用正式版,如果想要提供兩音以上,請最多呈現兩音,並以"/"分開呈現。

2.校對完成,請在編輯者欄簽名,系統每天凌晨會抓「簽名欄有資料的」進行前端更新。

3.校對時請注意,可能同一天會有好幾筆相同的資料進來,取其中一筆就好,原則上取有貢獻者簽名的、較前面的那筆,重複的資料,請在備註欄寫"重複"。

4.請挑自己有把握的校對即可,也只要如實地呈現該講法的正規漢字和臺羅,不用管他這樣講適當或不適當,如果自己真的看不下去,可以在前端查得到之後去投票"按呢怪怪"。

5.如果原本的資料就完全正確,也要複製到右邊三欄位,並簽名,表示檢查過了。

6.第一欄的編號請千萬不要改。

7.如果資料內容明顯是來亂的,可在備註欄填入"x",告訴大家這筆可以不用處理,並千萬不要簽名。

可以先看前面的人做的成果,有疑問請隨時私訊 iTaigi 粉專。

 

過往紀錄

A-TSIOH( 11 moed7ct )

Liz報告:http://j.mp/1GoASYi

POMIN W( 不得罷免黑客松 )pm5 報告:http://j.mp/1GoAV6x

LIZ L黑客松 Liz報告:https://youtu.be/qt6kTIPNWGE

 

以下是很漫長的討論過程

 

    LIZ L專案目的

LIZ L大家一起說台語

  • 年輕人失去說台語的動力與能力
  • 動力→除了文化自覺,更要實用又有趣
  • 能力→提供一個互動平台,加速產生新台語,使台語能在新時代中被順暢地使用
    venev突然想到,除了虛擬平台,是否也可能結合實體世界的「台語松」活動?可以實體的討論。
    A-Tsioh在平台的開幕典禮舉辦台語松:)
    che wei liu部分年輕人認為說台語是粗俗的, 讓台語古典化, 如何說的文雅一些, 提升台語的 "美感" ...
    Theo Yeh可以強調台語的精細,幼路的方面,像是很多人推的這一篇批踢踢的PO文: https://www.ptt.cc/bbs/Gossiping/M.1421146376.A.47C. htmlhttps://www.ptt.cc/bbs/TW-language/M.1421165196.A.9B0.html。逼個其實叫做義素分析(Seme Analysis/Analysis of Semantic Sememes)。關於什麼是義素分析,可以看這個pdf:漢語身體動詞義素分析—以「眼、口、手、足」語義子場為例。連結在此:http://163.21.236.197/~publish3/journal/432h&s/02.pdf
    Liz Lin我個人覺得每一種語言都有雅俗各種面向,只有單一面向的語言不是真實的。台語是個活生生的語言。*剛看到這本書 http://gushi.tw/archives/7602 或許是不錯的參考資料
    Lee

(學理補充)新台語的產生方式

A-TSIOH華語音音譯:經濟、元氣、紹介(日語);業者、強調(華語新詞);評估、微波爐(華語義譯);保齡球、菩薩、麥當勞、雷達(華語音譯)

    Khu Úi-him經濟跟元氣都是日語ㄟ。所謂的「和製漢語」,比如昆蟲,銀行,動物,植物...族繁不及備載。
    Liz Lin是啊,所以我本來就寫他是從日語來的,但台語在用的時候發音已經是台語的漢字發音了,這就是借詞的一種。
  1. 其他語言音譯:花思木、打馬膠、麭佮肉
  2. 表義 : 面冊、懸踏
  3. 古詞新用:懶孵、(電)烘爐
  4. 不轉譯使用:百香果、mai-kuh、server
    薛丞宏若華語「百香果」無轉譯使用,咱的語料愛按怎註明?
    薛丞宏漢字寫「我愛食百香果」,全羅寫「gua2 ai3 tsiah8 百香果」?
    Liz Lin我曾在全國語文競賽的朗讀文章創一個體例,凡台語文章中出現以華語直接發音者,以『』標示,所以會是:我愛食『百香果』。不過這個體例目前僅流通於中小學教師,還可以有其他表現方式自然競爭
    Khu Úi-him百香果台語本來就有相應的名詞:時計果/sî-kè-kó。台語沒有的詞彙有幾種情況,真的沒有;有,但是我們不知道。前者,有兩種處理的方法,外來語音譯或意譯,音譯的話比方iân-jín(engine),新詞比照相同規則處理。意譯可能對語感差的人會有困難,像是壽司,台語意譯是把他叫「醋飯/tshòo-pn̄g」而非su-sih,我們現在說的便當,另一個講法是「飯包/pn̄g-pau」。排除這些,很多時候是台語本來有的講法,但被「洗掉了」。舉例,瀏海,台語稱作「剪眉」,馬尾,台語說「毛尾仔」,熟女,台語稱作「姿娘仔」,把妹,台語可說成「詼七仔」,鮭魚是「紅鰱魚」,瓶鼻海豚是「大白腹仔」,大翅鯨是「海徛」(族繁不及備載...)。排除以上兩種情況,最常見的其實是「用華語思考所以找不到台語對應」。不同語言間本來就無法百分百對譯啦,解決的方法是,思考的「概念」比語言本身更重要,要從概念去發想台語怎麼講比較適當,而非從華語去思考要怎麼把詞彙變成/唸成台語。
    薛丞宏我想不管是意譯或是音譯都有辦法產生出臺語詞。不過像是英語有可能就不轉譯直接使用:像是hackpad在還沒產生出通用的意譯/意譯詞之前,總是要有一個方法記錄
    Liz Lin同義詞本來就會一直競爭然後淘汰或並存。

 

  • LIZ L不同的譯法各有優劣,具有活力的語言能很快產生各種譯法,透過傳播約定俗成,最後會有一種成為語言社群的共識。因此,這個平台不能違反語言的自然發展,但而是提供一個便利的平台,加速創造及約定俗成過程。

 

    A-Tsioh建議一個新詞可以請使用者用這個分類
    Liz Lin這個比較學理,是分析用的,對多數使用者來說可能不是很能掌握
    Liz Lin

    A-TSIOH系統概念(client-side這裡討論)

薛丞宏架構試做

LIZ L架構試做(1 moed8ct):https://moqups.com/liz462/IMYHBVi5

POMIN W程式:https://github.com/g0v/taigi

LIZ L點「台語怎麼講」是以「水母」做例子,點右邊的「婉君」會連到查詢無結果的情況。

    Liz Lin再來咧?
    Pomin Wu初步的 mockup 快做好囉(「程式」那個 repo),然後我要找個地方丟出來給大家看
    Liz Lin(下意識想按個讚XD)
    Pomin Wu還沒做「提供講法」和「每日一句」,請用想像的,看看這樣的操作合不合理。
    Pomin Wu放進去的測試資料只有「要 XX」所以請查這些詞就好 XD
    Pomin Wu然後我想先做一個首頁 g0v/ta-neologism/igi#1
    Pomin Wu還有弄得好看一點

POMIN W測試版的 mockup 目前放在 http://g0v.github.io/taigi-neologism/

    Ting Zhong Loou這個網址失效,File not found
    薛丞宏我先放在這
    Liz Lin丞宏,直接點還是一樣404
    薛丞宏好嘍~~把錯的刪掉了

 

薛丞宏頁面設計

  • 上方搜尋列(台語怎麼講)
    • 功能
      • 提供「查詢→求詞」服務
  • 這樣講
    • 功能
      • 顯示「查詢→求詞」的結果,包含辭典以及網友建議
      • 如果找不到結果,幫他發問,產生新的請教條
        • 「還不會」會多一條新的請教條
  • 來討論
    • 功能
      • 顯示「查詢→求詞」的討論狀況
    • 如果介面允許,可合併到「這樣講」
  • 還不會
    • 功能
      • 有人發問請教,但是還沒有人回答的「請教條」
      • 「尚未有對應講法的華語詞」
    • 目的
      • 讓熟悉臺語的人能幫忙回答問題
        薛丞宏我目前想到「還不會」的兩個問題:1.「請教條」什麼時候從「還不會」裡消失?是有人一回答就消失嗎?還是要維護團隊去控制?2.這樣變動會讓使用者覺得請教條「怎麼不見了」?除非我們另外註明「這些華語詞連一個台語翻譯都沒有」,或者我們另外顯示一個列表,把請教條「由新排到舊」,像討論區那樣,沒有人回答的請教條給他一個圖或標記。這樣子會不會比較好?還是說這兩個功能分開放?
        Liz Lin這牽涉維護團隊能否每日值班,如果團隊人數足夠,我想轉寫後再從「還不會」裡消失比較好。前端介面和邏輯越單純越好,我想我們在設計時必須跳脫我們對語言工具的熟悉度,讓使用者的負擔降到最低。
        Liz Lin請教條由新排到舊很棒!
  • 好工具
    • 功能
      • 相關網站連結

 

A-TSIOH查詢→求詞

    A-Tsioh這個其實是我們TMUSE的 好use-case
  • LIZ L輸入華語,可查詢到對應的台語講法,包括漢字、音標、音檔
  • 不限詞彙,也可一定限度容納熟語甚至短句
  • A-TSIOH同意(反正沒有人知道「詞」是什麼,跟我論文我關的問題XD)
  • LIZ L查得到,有兩種結果:
    1. 具有一定投票數量、受大家推薦的講法
    2. 剛產生或未具共識的講法
      薛丞宏如果是語句的話,我這邊可以提供粗略的語句翻譯,demo:http://意傳.台灣/標音方法
      薛丞宏不過注音符號沒時間修好就是了XD臺羅應該是正常的
  • 查不到→求詞
    Liz Lin多少人投票算是具有共識呢?如果能有一些學理支持更好

 

A-TSIOH 共同編輯

    A-Tsioh 我可能不是很懂這一點
    Liz Lin其實就只是把詞條的釋義寫上去,還有例句,大家一起寫,寫例句很重要
    A-Tsioh有道理,讓大家舉例子和comments,可是解釋我覺得應該還是原PO建議的人自己去改
    薛丞宏可以用看看stackoverflow那種投票系統嗎?或許符合我們的需求
  • LIZ L 現有的、已具共識的詞條
    • 說明、討論為什麼這樣翻譯
    • 補充例句,無限創意
  • 現有的、未具共識的詞條
    • 討論為什麼這樣翻譯、怎樣翻譯更好
    • 補充新翻譯
  • 還沒有詞條
    • 補充新翻譯
  • 除錯
    • 排名應該是在「翻譯都合理、喜歡哪一個」的前提下,如果有對譯根本對錯(比如初始資料的問題),應該要有一個功能是「向管理者反映這條可能有錯」(整理資料庫時覺得這個功能是必要的)
    薛丞宏好喲
  • 薛丞宏

A-TSIOH詞彙票選排名

LIZ L為喜歡的翻譯投一票

    Liz Lin會員才能投票嗎?
    A-Tsioh可以用FB、Google、email login

 

互動教學區

A-TSIOH創造語料語詞示示範

  • LIZ L•快遞:khuài-tē、緊送/隨送、快遞/express
  • •跑步:pháu-pōo、運動走/走步、走標、跑步
    Khu Úi-him健走/kiān-tsáu是比較好的說法,而且已經有被使用。
  • •漢堡:hàn-pó、美國肉包、麭佮肉、漢堡/hamburger
  • •帳篷:tiùnn-phâng、罩篷(tà-phâng)、帳篷/camp
    Khu Úi-himthèn-tooh是英文的tent,這是早就有的台語說法。

每日一句

  • 每天提供一句話,用新詞造句,附上音檔,也讓台語漢字和羅馬字一直曝光

每週一短篇

  • 每週針對當週時事選一小主題,進行一、兩分鐘的談話,也提供全文對照
    Liz Lin後面這兩個是我今天新產生的想法,對多數人來說,很難一下子要大家接受台語漢字和羅馬字,還是要給音檔,若每天都有新東西,應該比較能吸引大家常來玩。但這需要固定團隊經營,我想我可以組織一個團隊固定提供。
    A-Tsioh會很棒!
    莊銘彥我覺得可以將歌詞改成教育部的推薦用字
    Liz Lin歌詞的建議非常棒,因為是大家已經熟悉的內容,很容易理解和對照!
    A-Tsioh我本來想作的就是從歌詞開始修改文件!讚

 

 

    LIZ L網站經營及問題點

A-TSIOH音標用字怎麼解決

 

    A-Tsioh 是不是應該靠跟萌典同一個API ?(自己跳坑?)
    Liz Lin我的意思是說,一般人不會用台語漢字和羅馬字,他要怎麼提供他的翻譯?我覺得還是要經過標準化的改寫。
    A-Tsioh知道怎麼翻譯的人會寫不出來嗎?連漢字也不知道嗎?我以為不太會有這種情況(至少會認漢字)
    Yau-Hsien Huang發明適當的注音符號(用Latex可以打很多符號,選幾個來用),標示台語古韻八音。
    Yau-Hsien Huang古韻八音有八種動物代表,八種動物也是現成的音調符號。
    Khu Úi-him現代台語只有七音,沒有八音。台語書寫系統發展超過一世紀了。站在巨人的肩膀上看得更遠,我覺得,不要再重頭發明是比較好的做法。
    A-Tsioh使用者打註音,我們也可以提供audio (一個一個音節)讓他確定有沒有錯誤。
    A-Tsioh發明新的系統我不太相信會成功。(已經有很多,但是大數人沒學過)
    Liz Lin有沒有可能讓使用者點一個鍵就可以錄音呢?直接用講的,讓專業維護團隊轉寫
    A-Tsioh欸,其實有!這樣也可以crowdsource the transcription 讚!
    薛丞宏同意liz的做法,或者也可以讓使用者打字,我們再另外的人轉寫(翻譯)成正規臺語文
    薛丞宏打注音播聲音會有變調的問題,詞的變調較簡單,語句變調我最近會研究看看
    Liz Lin我原先的預設是打字和錄音都要,維護團隊根據文字和聲音進行正規化的轉寫。
    莊銘彥注音符號有現成的「臺灣方音符號」可以用

 

如何吸引群眾使用

    A-Tsiohconnect新詞平臺和FB ?
    A-Tsioh也可以找gaming的方式來做(好玩的平臺+有rewards的感覺)
    Liz Lin今天新補了每日一句和每週一短篇,我無趣的頭腦想不出有趣的點子
    A-Tsioh每日一句可以報道是誰提供的翻譯,就有reward !也可以考慮怎麼分數ˋ
    薛丞宏會使考慮plurk每天參加會有加分,或是stackoveflow讓大家互相評分,像是阿石講的成就((達到10題、100題之類)之類的也不錯
    Liz Lin台語鄉民名人堂,創造越多詞彙、得到「按呢講好」次數最多的前幾名會被列在名人堂牆上。
    Audrey TangCTBlue 在錄 g0v underground radio #3 時說,可以參考早期的 Urban Dictionary,多列一些別的(正經的)詞典不會收的 swear & slang words,「國罵三字經太遜了,至少要四個字」,這樣一下就紅了。
    Liz Lin立馬把片岡巖的粗口篇納入資料庫(大誤)。
    Audrey Tang就是有「kàn nī khai‑ki‑tsóo」的那篇嗎?我之前拿給我阿嬤看,她笑到不行,說編得超讚的。:+1:
    Liz Lin對,臺灣民俗誌,內容超豐富,圖文並茂,時尚雜誌也可以參考一下,因為有髮型服裝(樓歪了)
    Liz Lin然後那個Urban Dictionary好讚,很像很像,很像我想要的樣子
    一些酒色財氣的詞語也很適合放進這個詞典內,像這個請問一下一句麻將的術語。或是民俗用語憨番
    Vivianne Chenurban dictionary充滿超髒的字XDDD

 

Users Stories

    A-Tsioh我的瞭解:
    A-Tsioh
  1. XXX 用臺語怎麼說?
  2. 不知者A上平臺收訊。找不到可以加「請教條」
    1. 先看詞典,翻譯,近義詞
    2. 看其他的請教條
      A-Tsioh這都自動的意見,需要機器人的圖片表達是電腦的分析(所以還是會怪怪的)
  3. 不知者B可以upvote 請教條
    1. +1
    2. comments
  4. 知者可以看請教條(排熱門?),建議新詞
    A-Tsioh沒有人問,也可以給建議嗎?
    Liz Lin可以可以,可以鼓勵大家創造
    A-Tsioh還是先請他“問自己”,這樣每一個詞都有來源
    Liz Lin問自己XDDDDD 這個讚ˋ
  1. 鄉民們來投票喜歡哪個建議
    A-Tsioh語言學家也可以加一寫語義和語法的data
    Liz Lin這個讚!!!學者評點與說明,還有教學的功效!!!
  1. g0v export 最熱門的為萌典json format
    venevexport 到「代開發」的詞典編結軟體,然後再 export 到萌典
    A-Tsioh先進去輸入法:)
    A-Tsioh你有沒有考慮用輸入法系統算新詞的統計?
    A-Tsioh(問題是:我不太會相信一個想上網的輸入法
    A-Tsioh我以前想加一個分享資料的APP,用它控制使用者分享什麼
  1. 在FB分享熱門 請教條、建議和當選詞目
    A-TsiohFB 會報道「每日一句」

 

薛丞宏版權、著作權

  • 使用者提供的語料
    薛丞宏使用者提供的聲音/文字檔需不需要註明什麼拋棄權利,免得日後要把資料拿去應用有其他衍生問題?
    莊銘彥可能要註明一下

A-TSIOH初始資料來

    A-Tsioh希望的資料是怎樣的?
    Liz Lin就是說,有一些初步的新詞翻譯先當作基本資料給大家看,讓大家"看到"這個系統可以提供甚麼、在做甚麼。我手上有一些詞條,但是滿少的。
    A-Tsioh那可以去crawl 批踢踢的臺文版
    Liz Lin今天工作想到一個很棒的初始資料,陳憲國、邱文錫合編《新編華台語對照典》,已有電子檔,兩位前輩會很願意分享。資料頗多,而且都是華語為主詞條,列出對照的台語詞,很適合當作這個系統的初始資料。
    Liz Lin談的結果,作者一贊成,作者二有點猶豫,說再讓他想一想。或許也可以找楊允言老師,線頂辭典的資料庫也有對應。
    Liz Lin楊允言老師今天寄台華辭典資料庫給我了,超感謝!!!!
    似乎很少人知道網路上有「英台華辭典」的資料,是 Maryknoll 教會製作的。在這裡:http://www.taiwanesedictionary.org。然後有人把這資料做成 iOS app,在這裡:https://itunes.apple.com/TW/app/id870882300?l=zh&mt=8
    Audrey Tang吳守禮老師家族日前向維基基金會接洽,願意用 CC BY-SA 釋出吳老師全部的詞典資料庫。
    Audrey TangIRC 上的討論看來,如果是持續更新到 2000 年代,也許可以考慮作為足夠現代的初始資料?
    Audrey Tang2015-02-12 更新:https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/OpenWuDict 有這個計劃的概述。參考之前中研院協助整理的彙編,從吳老的造字對應到現代的推薦用字,再建置從臺語反查華語索引,感覺上大多寫程式可以做到,人力最後校對即可,或可參考。
    薛丞宏初始資料有限制什麼不匯入嗎?我覺得就算是古台文古辭典,在沒有新台文的情況下,也派得上用場。如果有個別例子太爛,就用投票讓他沉下去
    Liz Lin我個人覺得不用限制,我比較擔心的是「詞與詞的對應」會有許多非常不精確的結果出現,對單一使用者來說,可能會因為一兩次得到很詭異的結果而不使用這個網站。就試試看能創造出什麼吧。
    薛丞宏那這樣我們匯入資料後,要有人大略過濾詞條,然後我們就對「臺語」那邊評分,讓分數低的沉下去,分數高的浮上來

 

 

    薛丞宏網站視覺、設計UI/UX

    薛丞宏liz你可以能要把構想打一下哦

 

 

    薛丞宏網站操作流程和項目

  • 薛丞宏操作流程
  • 網站項目
    • A-TSIOHmain menu
      • User Login
      • 查新詞 (=建議)
      • 查請教
    • 新詞
      • view
      • add vote
      • add comment
      • add example
      • suggest related 請教
        薛丞宏suggest related是指?
    • 請教
      • view
      • add vote
      • add comment
      • add example
      • view similar
      • suggest related

 

請教條

  • 外語詞性
  • 什麼外語?
  • 詞性
    薛丞宏詞性每個人標的規則不同,而且詞性有許多規則,這要怎麼分類?
    Liz Lin我不建議放詞性,這個太麻煩了,而且以本系統的目的來說應該不需要
  • 例子
  • comments

 

建議條

  • 臺語漢字
  • romanisation
  • 詞性
  • 新詞造成的分類
    薛丞宏這也是詞性?
  • 解釋
    • 薛丞宏這和comments合併?
  • LIZ L例子
  • A-TSIOHcomments

 

 

    薛丞宏後端(server-side這裡討論)

  • 薛丞宏

開發程式與環境

  • github專案
  • 系統環境
    • linux/mac
    • python3
    • django 1.7
    • git
  • 開發環境
    • eclipse + pyDev
  • 開發流程
    • 先寫試驗(test),後實作

 

LIZ L資料表Data format

  • 薛丞宏架構
    • 「資料」分三個
      • 外語請教條
      • 臺語影音檔
      • 臺語文字資料
    • 另外的表記錄彼此資料間的「關係」
      • 請教條有哪些影音檔
      • 請教條有哪些臺語文字資料
      • 臺語影音檔有哪些文字資料
      • 文字資料最後的用字是哪個
    Liz Lin後端的資料會長怎樣?兩個詞彙之間不會完美對應,可能會有多對多的情況?
    Liz Lin資料庫會全部做成一對一,所以在華語那一欄,會有多筆重複的。我會先把手邊的兩個資料庫做成以上這個資料庫的形式,如果我搞不定再請大家幫忙
    薛丞宏考慮到最後呈現的形式是一個華語詞對應到多個臺語詞,我「關係」是做一個華語詞對應多個臺語詞,不過liz你那邊的資料庫不用特別處理,我匯入時再調整就好了

LIZ L資料庫要做的:

  • 整併
  • 抓錯
  • 臺羅調號轉調符
    薛丞宏上線前匯入初使資料時,整併和轉調符我可以一併處理(不過抓錯也可以直接在系統上抓?)

 

輸入的關鍵詞,部分符合的結果太多,會太不精確。(要再想)

  • 薛丞宏

A-TSIOH 主機及資料庫

  • 薛丞宏資料庫使用django的ORM物件語法,上線後會接pgsql
    薛丞宏要入營了,來不及寫解釋QQ
    Liz Lin丞宏,抱歉我是個非資訊人,用語不精確,我前面說的「資料庫」,指的是語詞基礎資料的整理,那個檔案裡面有些錯誤,需要整理一下,才能進到後端這一步。
    Liz Lin你目前的寫是用台文,但目前協作的人當中,似乎只有你我和柏中老師看得懂台文,我不知道這樣會不會導致其他伙伴很難進入,要是只有你一人在坑裡,那就不妙了喔!
    Liz Lin此外,A-TSIOH好像也開始動了,還有PominWu原本的進度,是不是有什麼方法可以讓各位更順暢地一起工作呢?實在抱歉,我不會寫code,所以也不知道怎麼規劃協調,需要協助!
    A-Tsioh說的沒錯,而且跟pm5談過server side本來打算用Flask,我有把Pomin的mockup 的 PhraseStore connect to一個 flask + SQLAlchemy的backend.其實跟 Django的models很像你可以試試看
    A-Tsioh(已經有admin的列子)
    薛丞宏我目前的想法是我負責設計資料庫,然後我只負責提供API,讓前端可以用get/post來撈資料/增加語料,我會用json回傳。我這邊就不負責html/js/css。我預計用test-driven試驗開發,確定好API給大家看,這樣工作效率應該會比較好一點。
    薛丞宏django雖然比較大隻,不過相對他東西也拆比較細。我覺得我們的網站日後應該比較好維護
    薛丞宏資料庫格式我有另外考慮文字轉寫和變調文本)的需求,所以我的表拆比較細
    薛丞宏而且我手邊有一些初使語料可以用,我再
    Liz Lin丞宏,感謝你的高效率。我想這必然是個需要依靠「協作」才能經營的網站,任何時候、任何有興趣也願意幫忙的人都可以來幫忙,所以挖出來的坑不能太深,否則以後會跳不出去,也沒有人可以接續(這好像是誰演講的時候說的對吧)。
    Liz Lin而「新台語運動」的目的,有點想突破過去台語圈的侷限,「盡可能降低台語的進入障礙」是很重要的前提,不論是前端或後端。僅有在「正規化轉寫」這個小團隊,才會真的要求台語文能力。
    Liz Lin所以,我想請pm5、A-TSIOH和丞宏討論一下後端要用什麼工具來開發,要一起協作的工程師都覺得OK,再繼續往下做,拜託了唷!!!
    Liz Lin而不管最後決定用什麼工具,考量協作者不一定熟悉台語文,還是請丞宏忍痛先不用台文,可以使用台文的地方非常多喔!
    Liz Lin
    Liz Lin那,沒有人要幫忙整理基礎資料是嗎?不然這個我就自己來。
    薛丞宏好的,其實這寫作的語言我也掙扎很久,我盡量用華臺共同詞寫程式,偶爾偷渡「無法度」之類的簡單臺文XD
    薛丞宏協作的部份,我一到五下單位的時候雖然時間很多,但是沒有電腦,我都是把程式印出來,然後手寫上去,六日回家再騰進電腦,可能無法即時的上傳到github。想問a-tsioh和pm5,我們是不是約個時間討論一下?我方便的時間是下週五晚上
    薛丞宏佳怡:你的「整理基礎資料」是指下面的「資料庫要做的」?
    Pomin Wu約時間好啊,嗯,不過不太確定「下週五」是指哪一天,是剛過完的那個週五嗎? o_Oa
    薛丞宏那個星期五已經過了xdd可以用fb聯絡嗎?

 

  • 後端系統預計放在中研院
    薛丞宏資料庫的部份我可以負責,主機我架在中研院OK嗎?我覺得我們沒有要營利應該是可以的
    薛丞宏我這週在軍營有整理資料庫格式了,我週末整理出來再貼連結上來
    A-Tsioh主機我也可以提供,看哪裏比較方便,哪裏比較快(我的話現在是在歐洲或美國的主機)
    A-Tsioh你原來是在當兵嗎?辛苦你!
    薛丞宏liz:網址記得想喲XD

 

 

    A-TSIOHAPI needed (back-end)

 

  • A-TSIOHUser Registration使用者管理
    venevFB+Google?
    A-Tsiohideally: any social platform + email
    • 薛丞宏情境
      • 加訊息(請教條/新詞影音/新詞文字/評分/意見/標註推薦用字)的時候需要登入帳號
    • 進度
      • API介面(含後端試驗)
      • 前端網頁套版
      • 後端程式實作
  • A-TSIOHadd 請教條
    • 薛丞宏情境
      • 當使用者搜尋不到請教條,可以發問
    • 進度
      • API介面(含後端試驗)
      薛丞宏我把成功和失敗的分兩個檔,「外語請教條加成功試驗.py」、「外語請教條加失敗試驗.py」
      薛丞宏
      薛丞宏可以請阿石和pm5幫忙看這樣溝通方式和api設計怎樣好嗎?
    • 前端網頁套版
    • 後端程式實作
  • A-TSIOHadd 新詞影音
    • 薛丞宏情境
      • 針對請教條,使用者以錄音的方式,提供新詞
    • 進度
      • API介面(含後端試驗)
  • add 新詞文字
    • 情境
      • 針對新詞影音,使用者可以提供母語的寫法
    • 進度
      • API介面(含後端試驗)
  • add users ranking評分
    • 情境
      • 大家投票給 請教條/新詞影音/新詞文字 看哪個好哪個壞
      • 分數好的可以在網頁上註明,讓大家參考
    • 進度
      • API介面(含後端試驗)
      • 前端網頁套版
      • 後端程式實作
  • add comments意見
    • 情境
      • 讓大家對 請教條/新詞影音/新詞文字 提供自己的意見
    • 進度
      • API介面(含後端試驗)
      • 前端網頁套版
      • 後端程式實作
  • 標註推薦用字
    • 情境
      • VENEV由專業團隊把無書寫規範的「鄉民台語」,轉化為「推薦寫法」。
      Liz Lin專業團隊好重要!!!!還要製作每日一句和每週一短篇!!!
      莊銘彥除了推薦寫法(推薦用字),可以再附上異用寫法(異用字)
      • 薛丞宏被標註的可以在網頁上註明,讓大家參考
    • 進度
      • API介面(含後端試驗)
      • 前端網頁套版
      • 後端程式實作
  • A-TSIOHvotes
    薛丞宏votes是指投什麼票呢?
    A-Tsioh就是投「新詞建議」的票
    莊銘彥為什麼劃掉了?
    薛丞宏我以為和users ranking一樣,那這兩個差別是?
    A-Tsiohusers ranking是指哪個user比較用功,哪個user的意見比較文雅等等 (是吧)
    薛丞宏那用大家針對請教條或新詞建議投票,每個詞條獨立記分,就當作該使用者的分數?類似stackoverflow那樣有reputation
    A-Tsioh恩(不過還可以分不同的ratings)
    薛丞宏除了針對詞條評分外,還有什麼可以投票?如果針對人投票感覺不合理,盡量讓大家有爭論時對事不對人,所以我才想說對詞條本身投票會比較好
  • search 請教條
    • 薛丞宏情境
      • 「XXX詞是不是已經有?」 -> TMuse on 國語<->臺語詞典 + 英文?
        • input : 國語或英文
        • output: list of twblg 詞條
      • 「YYY請教條有沒有被問過?」 -> elasticsearch ?
        • input : 請教條
        • output : list of 請教條
    • 進度
      • API介面(含後端試驗)
      • 前端網頁套版
      • 後端程式實作
  • A-TSIOHview 請教條
    • 薛丞宏功能
      • 顯示 請教條/新詞影音/新詞文字/評分/意見
      • 新詞影音可以照大家評分排順序
      • 新詞文字可以強調推薦用字和評分佳的

 

 

    A-TSIOHFront end 呢 :p

    薛丞宏
  • A-TSIOHfunctions
    • 薛丞宏romanisation 和表音 rendering (han.css, 輸入法API)

 

 

    薛丞宏分工

薛丞宏有問題要馬上說喲

 

兩位可以幫忙設計

兩位python

  • linux
    薛丞宏我用的是Mint Linux。建議用雙系統,用虛擬器會很難操作
  • django
  • unittest

三位前端

  • react.js
  • livescript
    薛丞宏請pm5看要怎麼分配工作

 

待分配(有閒先來看)

 

    LIZ L閒聊區

    Liz Lin第一次使用,還跟不太上這種討論方式的邏輯,所以我寫的東西歡迎重新編排。然後閒話也是寫在這裡嗎?
    A-Tsioh閒話可以用這種comment的方式,也可以在IRC或FB 討論 (當然email 也可以,只是他人看不到)
    azole我是路過的門外漢,看這個專案想到一個疑問,之前在朋友的FB上看到有人寫說:「還不加強英文這類國際語言,教什麼台語,完全沒有競爭力。」我回復他說,如果競爭力來自於放棄自己的文化,這是哪門子的競爭力。這是我自己相信的,但不知道該怎麼去說服別人,面對「學台語到底有什麼用?」這類的質疑,這個問題的答案應該是什麼呢?
    A-Tsioh我個人不太願意浪費時間說服別人,先做的事就做,別人喜歡就來用。若很多人喜歡就不用說服誰!問題是想作的是要怎麼做好
    Liz Lin看到「學台語有甚麼用」的發問我真是太開心了,因為這個點就是我在報告中提到與其他老師討論新 台語運動時,另一位主要參與者最想做的事,他想要透過行銷手法來處理,我覺得這兩個東西可以相輔相成!!!!但那就是另一個專案了~~~
    Audrey Tang終於看到有人問說「為什麼要學台語」,所以我的回答是「可以用台語寫程式」。我最近在 CodeProject 上寫了一篇技術文章講解如何用台語寫程式:http://www.codeproject.com/Articles/862071/Implementation-of-Natural-Programming-Method。當然我知道一般大眾是不會去看技術文章的,所以我有在想要怎麼推廣出去。
    azole推薦研究一下葉丙成老師的PaGamO,利用線上遊戲的方式去增加動機!
    A-Han Lin分享一個比較學術現實的觀點,台語或者說閩南語,比起其他漢語保留很多中古、上古層的漢語要素,它其實是蠻重要的古籍破譯工具,這是以前我跟師大國文系的教授聊,所得知的,而且跟一般人理解不同的,真正歷史較久的,不是文言層,而是白話層。最後分享一個idea,如果因為學了台語文,使得國高中國文的古文不需要註釋,就可以輕易讀懂呢?

 

 

 

    Liz Linserver要架在哪裡??
    Liz Lin萌典松中......接下來要怎麼辦呢?
    Audrey Tang接下來要把 線頂辭典的資料庫 (和授權)放到大家看得到的地方,作為初始資料開始做。
    Audrey Tang有 Google Drive 或 Dropbox 的網址嗎?有的話可以貼在這裡~
    Audrey Tang然後開始找填坑獸處理成 JSON 或 CSV 之類的結構化資料~ Tammy 那幾位外藉同學看來很有機會 XD
    Liz Lin好,我先跟老師談一下公開授權。網頁的設計沒有經過討論,不需要比較確定架構之後才開工嗎?之後要改建會不會很困難?
    Liz Lin( venev建議我可以找補助來支持這個案子,想了一下,不確定要不要搞這麼大)
    Audrey Tang可以 crowdfund 也可以找補助,但是先開工吧! 這樣才有東西可以 demo
    Liz Lin所以就是有人會寫程式的意思嗎????
    Audrey Tang對啊,Tammy 對面那幾位都是念資工的(白板下方),去問問嘛
    Audrey Tang授權尚未公開也可以先傳給他們看看啊(我有 USB Disk)...
    Audrey Tang後端可以用 http://140.112.147.131/editr/
    venev這個後端是什麼東西?(今天無法前往嗚嗚)
    venev線頂辭典的資料庫主要是要使用華語台語對應的部份?
    venev也要思考跟未來台語詞庫/詞典整合,儘量不要重複工作。
    Liz Lin資料庫樣式是一台語對多華語,華語欄用分號區隔。我們的資料庫樣式應該是以華語為主,但是會一個華語對多個台語
    Liz Lin我會注意整合,目前用想的覺得不會做白工也沒有衝突
    Pomin Wu目前還在做 mockup 與前端,因為似乎有些資料庫可以先丟進去看看呈現的結果,所以先弄一下前端看看
    Pomin Wu後端還空著沒有人做,要選什麼都可以
    Pomin Wu台語詞庫如果是台語->拼音對應的話,也可以之後有華語對應(不論是使用者輸入或是其它來源)以後再把三方資料整合進這個網站裡。只要拼音標準一樣,應該是沒有問題的。
    Liz Lin感謝pomin,突然又覺得很有希望XD 原來程式是可以好幾個人一起寫的
    Liz Lin我把整個討論稍微整理一下,希望這樣比較清楚,不過最後這兩大區我看不懂,就先這樣放著喔。
    JCtw非常甲意這個 idea. 挖勒試看麥安怎用台語打字。嗯孤(不過)畢竟語言是活的,總係要使用。好處斗洗大部分A台灣郎攏有咧用臺語,只係因為台語並無統一A文字,哩看馬揪拍看,挖打字馬洗揪拍打。(嘗試打台語結束) 我剛要講的是,我也一直覺得很遺憾我的台語只停留在能跟阿嬤聊天的程度,不像是我的中文或者英文的使用都可以深度討論學術問題或者哲學問題。台語源自中國最古老的語言之一,它可以讀古詩詞,曾經台灣的菁英份子也都是用台語在交流最先進的思想(例如日治時期),蔣渭水等各界菁英當時在討論台灣在日治時期的自治條例,向日本國會請願等等的會議都是使用台語(我是說他們當初台灣人之間開會所使用的語言啦,對日本國會提議當然是使用日文)。如今由於過去70年政黨刻意透過各種手段來讓台語消失,他們成功地讓台語從主流變成弱勢,他們的政治目的已經達到了。如果我們要復興台語,除了開發這些學習工具之外,其實首先大家都要使用台語才會變成真正的讓一個語言活過來的.... essence. 否則的話,現在的台語有點類似拉丁文,停留在也侷限在它被使用到最盛期的時候(例如那些從日文翻譯過來的台語)。總之,還是很開心有這個 project 的存在。我希望很快在未來的某一天,我們都可以在網路上使用台語交換黑客資訊以及 open data 資訊。把台語 upgrade 到跟的上我們現在的使用程度。
    薛丞宏大家一起加油嘍!!
    曾紹祥 你們好,我是資訊科學系的同學,想對這個專案提供程式上的協助,請問能跟誰聯繫呢?
    Liz Lin目前後端的code是薛丞宏在寫,你可以直接跟我聯絡,FB Liz Lin,這裡我是用FB登入的應該找得到,謝謝你
    Vivianne Chen你們有需要UX或UI設計師嗎,我對這個專案有興趣

 

    clin4j一點想法:
    • CLIN4J搜搜尋可以考慮elastic search 加上 NLP, 這樣資料可以儘量保持原樣.
    • 想學台語的人有滿多是不知道怎麼發音, 找不到人可以練習. 也許提供一個可以找人練習的平台會有點幫助. 有點像透過line, skype群組或個人練習口語會話, 或白版練習寫作.
    • 另外我可以幫忙後端的部份.
    Audrey Tang想問一下,有那個區塊在處理音標的嗎?學台語不學音標之類的會不順利吧
    Audrey Tang

 

    LIZ L2015 6/13 大松

AUDREY T

 

 

LIZ Lhttps://github.com/g0v/itaigi/blob/master/logo.sketch

 

 

AUDREY Thttps://moqups.com/liz462/IMYHBVi5/

  • LIZ L本來設定輸入華語、查台語,現在也可以輸入台語查台語(8/7補充:台語查台語,和華語查台語,出來的結果用顏色標示出來,讓使用者知道現在看的目標詞還是華語),未來要加入輸入火星文查台語
  • 異用字納入搜尋,對應正確的字出來(當使用者想要輸入台語的時候用的)
  • (6/20新增)是否要設計一個可以讓使用者回報問題的管道?

 

  • 漢字音標正規化團隊的運作與回饋:
  • 1.以程式給google文件供團隊校對,每天更新回程式一次
    • 薛丞宏直接在網站上編輯會不會比較好?
      Audrey Tang我本來是想 Google Spreadsheet embed... 只匯出匯入它的 selected view
      Audrey Tang避免認知過載
      Audrey Tang
  • 2.正規化團隊成員列表:
    • FB連結到該位成員,這個人做了多少工作、哪些工作,他正規化過的詞條可以分享(以達到炫耀的功能)
    • (6/20新增)正規化團隊募集:如果工作量不多,找認識的、有此能力者即可。但若工作量大,可以對外招募,liz可以設計一份漢字音標的測驗卷,線上考試,達某個分數即可加入正規化團隊。

 

  • 台語說法的原始提供者,可以得到訊息:你提供的詞條已被正規化;你提供的說法有XX則討論。
  • 給求講法者的回應:如果我詢問的詞已經有人提供講法、並且經過正規化上傳後,丟訊息給求講法的人說他的問題已經有人回應,歡迎討論

 

  • 每日一詞/影音:設計2~3個版型,文字就好,可以讓產出者輸入一兩句話或一段文字(包括漢字和台羅),然後錄音上傳,前端就可以看到圖片加聲音,一天一句學台語。(如果穩定的話,可以七天一輪,每天一種形式,由七組人提供不同的內容。)(要可以看到舊資料!)
  • 「還不會」那裡要拉壩!!!
    • AUDREY T顯示三個待填的查詢讓人填,按鈕再換三個
    • 一鍵分享到臉書和 PTT
      • Audrey Tang\\取之於笨版,用之於笨版/

 

 

 

  • 首頁的「怎樣講」換成「台語怎樣講」
  • 結果頁的「閩南語」字樣去除,加上「華語:」字樣
  • 程式內部的「請教條」這三字拿掉
    薛丞宏我先改api
    Audrey Tangthanks!
    薛丞宏做好矣

 

    Audrey Tang火星文轉台語的第零次研究文獻:

AUDREY T*

http://www.slideshare.net/autang/ss-49340426

 

 

    LIZ L2015 8/23 大松(圖文影音規劃)

  • LIZ L進度一:前端

 

 

  • 進度二:圖文影音貢獻規劃
    • 內容說明:網站除了查詢,也要有歡樂學台語的功能,因此希望規劃一個「圖文影音區」,以有趣的方式吸引大家看,過程中至少可以學到一兩句台語。
    • 參考材料:
    • LIZ L形式及內容發想
      • 知名動漫電影電視劇台詞台語的講法和解釋。例如以下句子的台語講法:「可是瑞凡,我們回不去了」、「賤人就是矯情」、「蓋上這張牌,結束這一回合」、「料理要帶給人們幸福」(圖片、漢字、臺羅、錄音)(圖片可能有著作權問題?)
      • 鄉民看時事。例如以下句子的台語講法:「2016唯一支持柱柱姊」、「這不是聞腋,什麼才是聞腋」、「你的黑箱是我的夢鄉」(新聞連結、漢字、臺羅、鄉民短評)
      • 很正經的世界名著、名作、名言台語說明。例如以下用台語說明(3分鐘以內):小王子簡介、「道不行,乘桴浮於海」、達利作品介紹。
    • 貢獻流程規劃
      • 為了減輕維護團隊的負擔,概念上是提供台語支援,但貢獻者要完成全部內容。
      • 狀況一:提供完整檔案(圖文或影音)
      • 狀況二:呼叫台語支援
        • 提供半成品並說明所需要的支援
        • 正規化團隊提供資源
        • 回饋貢獻者
        • 回到狀況一
      • 貢獻者標示、個人blog連結(甚至廣告?)
      • 製作徵求貢獻的頁面
    • 非主動貢獻:蒐集有趣素材加入教學,例如整合阿龍說台語阿龍台語有問題

 

    Theo Yeh有最近的更新嗎?

 

需要台語螞蟻:將資料庫中不是教育部漢字的改為正確的教育部漢字,總共有大約七千筆資料,能做多少算多少,改過請在紅色那欄打個勾或簽名:

https://docs.google.com/spreadsheets/d/1K_bsnk31w0pw1nQK21aWJVy_jYK8Q_3Sf7woyZ2cBiw/edit?usp=sharing

(羅馬字若要修改請用教羅,之後會用電腦改)

    Richard Hsieh不太懂這個意思"不是教育部漢字"、"正確的教育部漢字"
    Liz Linhttp://twblg.dict.edu.tw/ 統一用字以避免資料重複

 

 

    LIZ L2015 1226大松

LIZ L影音工作

影音測試:https://youtu.be/G8x-thF2wmc

圖片測試:https://www.facebook.com/ukauitaigi/photos/a.1661030874179270.1073741826.1661026360846388/1661106810838343/?type=3&theater

粉專:https://www.facebook.com/ukauitaigi/

 

網頁錄音套件:http://audior.ec/recordmp3js/

 

盤點尚未完成的主要功能

  • (1)使用者登入(今天預定工作)
  • (2)討論區(詞條翻譯討論)
  • (3)提供台語講法(詞條區、還不會區[拉霸])
  • (4)正規畫團隊工作區(使用google sheet,改完之後回到前端呈現)
  • (5)首頁影音(今天預定工作)