cn: Simplified Chinese (Mainland China)tw: Traditional Chinese (Taiwan)twp: Traditional Chinese (Taiwan, with phrase conversion)hk: Traditional Chinese (Hong Kong)jp: Japanese Shinjitai
以 StarCC 標準(稱為 st)為中介。
例如 cn 轉 tw,方法是先使用 CN2ST,再使用 ST2TW。
參看 StarCC0/dict。
未來還將加入:
- 日本擴張新字體
jpe - 香港用詞
hkp - 新馬用詞
sgp
用 Trie 正向最長匹配。
如果先 CN2ST,再 ST2TW,則需要分別構造兩個 Trie 樹。
若有多種對應方法,程式只選擇第一個。
為了改進簡轉繁時的「擁有 116 年曆史」型錯誤,在 CN2ST 時,應當使用外部分詞工具分詞,再對每個詞分別作轉換。
用字方面使用 StarCC 用字(如「爲」、「牀」,繼承自 OpenCC 用字)。
用詞方面採用中國大陸用詞(繼承自 OpenCC)。
例如,在 zh-CN 轉 zh-TW 時,是先使用 CN2ST,再使用 ST2TWP。第一步不發生用詞的轉換。
TODO