有時候在網路上看到的新聞是簡體的,可是很想把它變成繁體,大家通常都會把它抓下來,然後貼在 Word 進行繁體與簡體的轉換。
不過當新聞數很多的時候,這樣的作法似乎有點費力,所以我們就想使用程式來進行自動化的轉換。
Java 有人開發出一套簡體轉繁體、繁體轉簡體的 API,網址如下:
https://code.google.com/p/java-zhconverter/downloads/detail?name=ZHConverter.jar&can=2&q=
請到該頁面下載它的 jar 檔,然後 import 到你的 Java 專案裡面。
接著就像下列的程式碼一般,就可以進行轉換了,以下我提供了兩種使用該 API 的寫法:
import com.spreada.utils.chinese.ZHConverter; public class converter { public static void main(String args[]) { //繁體轉簡體 ZHConverter converter = ZHConverter.getInstance(ZHConverter.SIMPLIFIED); String simplifiedStr = converter.convert("有背光的機械式鍵盤"); System.out.println(simplifiedStr); /* 輸出結果: 有背光的机械式键盘 */ //簡體轉繁體 String traditionalStr = ZHConverter.convert(simplifiedStr, ZHConverter.TRADITIONAL); System.out.println(traditionalStr); /* 輸出結果: 有背光的机械式鍵盤 */ } }
應該有注意到,簡體轉繁體的時候有些字居然沒有改變,像是例子中的 "機" 轉不回來,簡體轉繁體會有一對多的問題,在此我稱為異體字,解決這問題可能需要一個對照表或是人工去判讀才可以。
另外,zhConverter的License是MIT,請參考下列連結:
https://github.com/rny/ZhConverter/blob/master/LICENSE
文章標籤
全站熱搜
留言列表