GitHub
中研院日前開源釋出了自行研發多年的自動化中文斷詞程式,讓開源社群和學術圈大感振奮,不過一開始誤用了較不易散播的創用CC BY-NC-SA 4.0授權,也引發熱議,後來中研院也調整授權改採用正式GPL-3.0授權釋出,以符合自由使用的開源(Open Source)精神。有意用於封閉商用軟體者仍須另行授權。
從事中文NLP(自然語言處理)研究的中研院CKIP Lab中文詞知識庫小組近日在GitHub 發表了一個中文斷詞工具開源專案,將封閉多年的自動化中文斷詞程式正式對外開源,一釋出就引起熱烈迴響,更讓它在GitHub上的支持度(星數),短短幾日就超過700顆以上,目前仍持續攀升中。
但一開始在GitHub釋出這個中文斷詞程式時,中研院採用創用CC BY-NC-SA 4.0授權(也就是姓名標示、非商用、相同方式分享),也引起社群熱烈討論,原因在於,CC BY-SA授權條款並未清楚規範軟體授權(software license)的使用,尤其,不同開源授權條款之間,原本就會有彼此相容問題,採用CC BY-SA授權更是如此,無法混用不同授權的程式碼,尤其是目前主流開源授權,如GPL-3.0或Apache-2.0,也不易於散播,就連CC官方自己都不建議採用,而要大家選擇自由軟體基金會提供的無償授權或其他開源授權方式。又如先前中國開源的中文斷詞工具Jieba(結巴)則採用MIT授權。
後來,中研院CKIP Lab中文詞知識庫小組也決定採用新授權,並在昨晚(5日)重新調整為更適合的授權條款,改採用正式GPL-3.0(GNU General Public License v3.0)釋出,代表任何人都可以自由使用、修改、發布該原始碼,對於因修改GPL程式產生的衍生源碼的授權,也比較有清楚規範,更符合開源精神。
適用新授權後,目前中研院這套中文斷詞程式CkipTagger,採用GPL與傳統商業授權並行,換句話說,如果是學術研究或其他商業用途,任何人已經皆可自由使用、修改、發布該程式源碼,但必須符合GPL-3.0的授權規範,而倘若採用GPL-3.0授權版本做為商業使用,同樣得要套用GPL提供衍生源碼;但若希望採用非提供衍生源碼的傳統商業模式,則可另洽中研院團隊付費,以取得傳統的商業授權。
熱門新聞
2024-11-25
2024-11-25
2024-11-15
2024-11-26
2024-11-15
2024-11-25