undefined

Tregex是一套用來觀察 stanford parsing tree結果,並且自建 tree regular expression來符合pattern的工具。

下載網址如下:

https://nlp.stanford.edu/software/tregex.shtml

t_1.jpg

 

下載後解壓縮得到下列的資料夾內容:

t_2.jpg

 

點擊 standford-tregex.jar 即可打開視窗模式操作,如下圖:

t_3.jpg

 

接下來介紹如何建立輸入的資料,請參考:

http://xken831.pixnet.net/blog/post/448840217-%5btextmining%5dstanford-parser-%E4%BD%BF%E7%94%A8%E6%96%B9%E5%BC%8F

產生一個 parsing tree.

 

並且將這個 parsing tree複製,存到txt檔。

接著就在視窗介紹的Tregex點擊左上角的file,並且選擇 Load trees,把剛剛建立的txt讀進來。

t_4.jpg

 

接下來就可以顯示Tree:

t_5.jpg

 

接下來我們使用自定義的Tree regular expression來找出符合這個pattern的部分。

我們在下列欄位輸入pattern: NP < NN

t_6.jpg

 

然後下列的Parsing tree 的紅色部分就是符合 pattern 的部分。

t_7.jpg

arrow
arrow
    全站熱搜

    葛瑞斯肯 發表在 痞客邦 留言(0) 人氣()