在找出文字相關詞(包含上下文、共同常出現的詞或同義詞)的時候,過往都是用人工編撰的詞典,想當然爾,精確度肯定很高,不過需要耗費大量人力,並且無法自動化。
Mikolov et al. (2013)於2013提出兩種模型架構來呈現字詞的向量,分別是skip-gram與continuous bag of words (CBOW),實驗結果顯示這兩個模型所訓練出來的300維度向量,均可有效找出語意相似與句型用法相似的詞彙。
在找出文字相關詞(包含上下文、共同常出現的詞或同義詞)的時候,過往都是用人工編撰的詞典,想當然爾,精確度肯定很高,不過需要耗費大量人力,並且無法自動化。
Mikolov et al. (2013)於2013提出兩種模型架構來呈現字詞的向量,分別是skip-gram與continuous bag of words (CBOW),實驗結果顯示這兩個模型所訓練出來的300維度向量,均可有效找出語意相似與句型用法相似的詞彙。