中文DNN词向量
依托全网海量优质数据和深度神经网络技术,通过词语向量化实现文本的可计算,帮助您快速完成语义挖掘、相似度计算等应用。
功能介绍
词向量计算是通过训练的方法,将语言词表中的词映射成一个长度固定的向量
词表中所有的词向量构成一个向量空间,每一个词都是这个词向量空间中的一个点,利用这种方法,实现文本的可计算
技术特色
大数据
使用百度大规模网页数据进行模型训练,样本数据丰富
深度学习
基于深度学习技术建立词向量表示模型
精度高
词向量精度高,能够准确描述词和词之间的相似度

应用场景
标注数据比较少的DNN任务
当DNN任务的标注数据量比较少的时候,可以用已训练好的词向量作为模型的初始化参数,模型效果一般会优于随机初始化的词向量。
近似词挖掘
通过词向量中的空间距离可以判断两个词在语义、语法上的相似度,因此可以挖掘出当前词的近似词。
作为模型初始化参数应用于其他的模型中
例如序列标注、标题党识别、图文匹配搜索等,用词向量作为模型的初始化参数,效果优于随机初始化参数
立即获取免费API Key
现在试用,获取免费API Key,免费调用各项开放能力API