close

undefined

介紹

IK Analyzer斷詞系統開發語言為Java,是為了建立在Lucence專案裡面的元件而發展的,最早期的版本出現在2006年。此斷詞系統有不同的斷詞模式: 最小粒度斷詞與智能斷詞,其主演算法本身為辭典式斷詞。

 

可至下方連結下載 library:

https://code.google.com/archive/p/ik-analyzer/downloads

 

ik_1.jpg

 

下載完後,解壓縮,可看到下列的檔案內容:

ik_2.jpg

 

之後將IKAnalyzer2012.jar import到欲使用的專案中,並且把IKAnalyzer.cfg.xmlstopword.dic擺到專案底下。

之後使用下述的 Sample code即可開始執行:

String sentence2 = "我想看電影";
StringReader sr = new StringReader(sentence2);
		
// IK Segmenter
IKSegmenter segmenter = new IKSegmenter(sr, true);
Lexeme lexeme = null;
while((lexeme = segmenter.next())!=null){
	System.out.println(lexeme.getLexemeText());
}

 

 

執行結果:

想看

 

 

arrow
arrow
    全站熱搜

    葛瑞斯肯 發表在 痞客邦 留言(0) 人氣()