Hackpads are smart collaborative documents. Join Hackpad Now.

源丁

2130 days ago
Common Voice 句庫松 2
Irvin C (本 pad 短網址)  bit.ly/2E3AMec
 
前次活動紀錄: Common Voice Sprint
 
  • 基本介紹
 
 
  • 今年前半的目標
  • 六月錄音達 400 小時 / 中文(目前 40 小時)
  • 句子總數三月達到 7200 句(翻倍)
  • 今年由 Deep Speech 釋出中文辨識模型
 
  • 台灣討論空間
 
 
  • Mozilla 相關專案
  • 包含 A-Frame (HTML VR framework)、Unity WebVR Assets、與其他 VR 實驗
 
  • 現有中文語音資料集
  •  
 
 
可用資料來源
 
基本限制:
  • 相容 CC0,完全沒有版權限制的資料
  • 個人捐出(對話紀錄、blog、著作)
 
  • 政府與公務員公文書、新聞稿(各政府單位新聞稿、公務員著作)
Guest
  • 著作權法第九條規定的文件不受著作權保護
  • 下列各款不得為著作權之標的︰
  • 一、憲法、法律、命令或公文。
  • 二、中央或地方機關就前款著作作成之翻譯物或編輯物。
  • 三、標語及通用之符號、名詞、公式、數表、表格、簿冊或時曆。
  • 四、單純為傳達事實之新聞報導所作成之語文著作。
  • 五、依法令舉行之各類考試試題及其備用試題。
  • 前項第一款所稱公文,包括公務員於職務上草擬之文告、講稿、新聞稿及其他文書。
  • 因此政府新聞稿、公務員講稿可用
Irvin C
  • 唐鳳會議記錄 
  • 爬維基百科 CC0 資料的 python script
 
 
  • 本次成果收集
大家把成果 link 貼上來:
 
 
 
 
 

Contact Support



Please check out our How-to Guide and FAQ first to see if your question is already answered! :)

If you have a feature request, please add it to this pad. Thanks!


Log in / Sign up