2018.01.26
一、如何使用gesim
1、几个关键术语
Corpus:语料,包括最原始的文章、词袋、以及词向量,
Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量
model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义
一、如何使用gesim
1、几个关键术语
Corpus:语料,包括最原始的文章、词袋、以及词向量,
Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量
model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义
nlp网站
http://www.hankcs.com/nlp/ 讲解分词、词性标注、
word2vec和fasttext比较