OneJane
文章69
标签83
分类12
基于ML的中文短文本分类(6)

基于ML的中文短文本分类(6)

对每一条输入数据,判断事情的主体是谁

中文命名实体提取(14)

中文命名实体提取(14)

基于ML的中文短文本聚类(7)

基于ML的中文短文本聚类(7)

文本聚类是将一个个文档由原有的自然语言文字信息转化成数学信息,以高维空间点的形式展现出来,通过计算哪些点距离比较近,从而将那些点聚成一个簇,簇的中心叫做簇心。一个好的聚类要保证簇内点的距离尽量的近,但簇与簇之间的点要尽量的远。

nlp基础(1)

nlp基础(1)

目前,随着大数据、云计算对关系型数据处理技术趋向稳定成熟,各大互联网公司对关系数据的整合也已经落地成熟,笔者预测未来数据领域的挑战将主要集中在半结构化和非结构化数据的整合,NLP 技术对个人发展越来越重要,尤其在中文文本上挑战更大。

中文短文本分类(22)

中文短文本分类(22)

目前,随着大数据、云计算对关系型数据处理技术趋向稳定成熟,各大互联网公司对关系数据的整合也已经落地成熟,笔者预测未来数据领域的挑战将主要集中在半结构化和非结构化数据的整合,NLP 技术对个人发展越来越重要,尤其在中文文本上挑战更大。