close
介紹
IK Analyzer斷詞系統開發語言為Java,是為了建立在Lucence專案裡面的元件而發展的,最早期的版本出現在2006年。此斷詞系統有不同的斷詞模式: 最小粒度斷詞與智能斷詞,其主演算法本身為辭典式斷詞。
可至下方連結下載 library:
https://code.google.com/archive/p/ik-analyzer/downloads
下載完後,解壓縮,可看到下列的檔案內容:
之後將IKAnalyzer2012.jar import到欲使用的專案中,並且把IKAnalyzer.cfg.xml與stopword.dic擺到專案底下。
之後使用下述的 Sample code即可開始執行:
String sentence2 = "我想看電影"; StringReader sr = new StringReader(sentence2); // IK Segmenter IKSegmenter segmenter = new IKSegmenter(sr, true); Lexeme lexeme = null; while((lexeme = segmenter.next())!=null){ System.out.println(lexeme.getLexemeText()); }
執行結果:
我
想看
電
影
全站熱搜