天机技术干货|Word2vec在风控中的应用

发布日期:2019年6月06日 作者:融360原创

NLP领域中,最细的粒度是词,词成句、句成段、段成章。很显然NLP问题从最基础的词出发。词本身是一种符号,不可量化不可用数值描述,需要把词映射成到数值向量空间(词嵌入embedding),word2vec就是其中一种。NLP中,语言模型(CBOW上下文做输入预测某个词本身、Skip-gram用某个词预测可能的上下文)的目的就是判断上下文词之间的相对位置是否接近真实情况,word2vec正式语言模型的产物,不要求语言模型最终效果逼近真实情况而是关心模型训练完成后得到的神经网络权重,这些权重就可以作为某个输入词的向量化表示。

查看详情