OneJane
文章69
标签83
分类12
nlp基本概念及算法

nlp基本概念及算法

整理的一些基本算法及概念

动手实战中文句法依存分析(16)

动手实战中文句法依存分析(16)

句法分析被用在很多场景中,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。

中文短文本分类(22)

中文短文本分类(22)

目前,随着大数据、云计算对关系型数据处理技术趋向稳定成熟,各大互联网公司对关系数据的整合也已经落地成熟,笔者预测未来数据领域的挑战将主要集中在半结构化和非结构化数据的整合,NLP 技术对个人发展越来越重要,尤其在中文文本上挑战更大。

HMM和CRF(8)

HMM和CRF(8)

HMM(隐马尔可夫模型)和 CRF(条件随机场)算法常常被用于分词、句法分析、命名实体识别、词性标注等。由于两者之间有很大的共同点,所以在很多应用上往往是重叠的,但在命名实体、句法分析等领域 CRF 似乎更胜一筹。

基于ML的中文短文本分类(6)

基于ML的中文短文本分类(6)

对每一条输入数据,判断事情的主体是谁

Neo4j从入门到构建一个简单知识图谱(20)

Neo4j从入门到构建一个简单知识图谱(20)

Neo4j 对于大多数人来说,可能是比较陌生的。其实,Neo4j 是一个图形数据库,就像传统的关系数据库中的 Oracel 和
MySQL一样,用来持久化数据。Neo4j 是最近几年发展起来的新技术,属于 NoSQL 数据库中的一种。

基于情感词典的文本情感分析(12)

基于情感词典的文本情感分析(12)

目前情感分析在中文自然语言处理中比较火热,很多场景下,我们都需要用到情感分析。比如,做金融产品量化交易,需要根据爬取的舆论数据来分析政策和舆论对股市或者基金期货的态度;电商交易,根据买家的评论数据,来分析商品的预售率等等。

基于CNN的电影推荐系统(10)

基于CNN的电影推荐系统(10)

本文从深度学习卷积神经网络入手,基于 Github 的开源项目来完成 MovieLens 数据集的电影推荐系统。

基于LSTM轻松生成各种古诗(11)

基于LSTM轻松生成各种古诗(11)

目前循环神经网络(RNN)已经广泛用于自然语言处理中,可以处理大量的序列数据,可以说是最强大的神经网络模型之一。人们已经给 RNN
找到了越来越多的事情做,比如画画和写诗,微软的小冰都已经出版了一本诗集了。

中文命名实体提取(14)

中文命名实体提取(14)