使用 Stanford 中文斷詞系統,首先,請到下列的網址:

http://nlp.stanford.edu/software/segmenter.html#Download

並且下載下圖中框起來的部分。

1.jpg

 

下載完,解壓縮就可以看到下列的資料結構:

2.jpg

 

Sample Code 請打開 SegDemo.txt

或者直接參閱我下列寫的程式碼:

再輸入程式之前,請 import slf4j-api.jar, slf4j-simple.jar, stanford-segmenter-3.6.0.jar stanford-segmenter-3.6.0-sources.jar

並且把 data 整個資料夾複製到你的 java 專案底下:

 

 

然後執行就可以看到斷詞結果了。

[我, 住在, 美國]

arrow
arrow

    葛瑞斯肯 發表在 痞客邦 留言(1) 人氣()