0 0 0

自然语言处理原理与技术实现.pdf

香草味丶布丁
29天前 330
我用夸克网盘分享了「自然语言处理原理与技术实现.pdf」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
自然语言处理原理与技术实现 作者: 罗刚/张子宪 出版社: 电子工业出版社 出品方: 博文视点 出版年: 2016-5 页数: 443 定价: 79.00元 装帧: 平装 ISBN: 9787121286209

内容简介

自然语言处理技术已经深入我们的日常生活。我们经常用到的搜索引擎就用到了自然语言理解等自然语言处理技术。自然语言处理是一门交叉学科,涉及计算机、数学、语言学等领域的知识。 《自然语言处理原理与技术实现》详细介绍中文和英文自然语言处理的原理,并以Java 实现,包括中文分词、词性标注、依存句法分析等。其中详细介绍了中文分词和词性标注的过程及相关算法,如隐马尔可夫模型等。在自然语言处理的应用领域主要介绍了信息抽取、自动文摘、文本分类等领域的基本理论和实现过程,此外还有问答系统、语音识别等目前应用非常广泛的领域。在问答系统的介绍中《自然语言处理原理与技术实现》特地介绍了聊天机器人的实现过程,从句子理解、句法分析、同义词提取等方面揭示聊天机器人的实现原理。 《自然语言处理原理与技术实现》详细介绍自然语言处理的各个领域,既有理论,也有实现过程。对于打算从事自然语言处理研究的计算机、数学或语言学领域的专业人士,《自然语言处理原理与技术实现》是难得的入门教材。

作者简介

罗刚,猎兔搜索创始人,带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔信息提取系统、猎兔智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测。曾编写出版《自己动手写搜索引擎》、《自己动手写网络爬虫》、《使用C#开发搜索引擎》,获得广泛好评。在北京和上海等地均有猎兔培训的学员。张子宪,聊城大学教师、中国矿业大学(北京)博士生,研究方向:自动句法分析、机器翻译。

网友热评

云下: 也就分词部分可以看看...后面的感觉都在拼凑... 纳言纳谏: 全书11章 涉及文本挖掘的各个方面 除原理外 还有Java代码 案例以中文举例 介绍的比较全面 但较浅 pwlazy: 这本书是我读过体验最差的,除了开篇对于统计模型还算清楚,后面就是很杂乱的堆砌了,有些原理都没讲清楚,就直接上代码,章节之间的关系也比较混乱,有些章节讲的也太简单了,强烈不推荐

图书目录

第1章 应用自然语言处理技术 1 1.1 付出与回报 2 1.1.1 如何开始 2 1.1.2招聘人员 2 1.1.3学习 3 1.2开发环境 3 1.3技术基础 4 1.3.1Java 4 1.3.2规则方法 5 1.3.3统计方法 5 1.3.4计算框架 5 1.3.5文本挖掘 7 1.3.6语义库 7 1.4本章小结 9 1.5专业术语 9 第2章 中文分词原理与实现 11 2.1接口 12 2.1.1切分方案 13 2.1.2词特征 13 2.2查找词典算法 13 2.2.1标准Trie树 14 2.2.2三叉Trie树 18 2.2.3词典格式 26 2.3最长匹配中文分词 27 2.3.1正向最大长度匹配法 28 2.3.2逆向最大长度匹配法 33 2.3.3处理未登录串 39 2.3.4开发分词 43 2.4概率语言模型的分词方法 45 2.4.1一元模型 47 2.4.2整合基于规则的方法 54 2.4.3表示切分词图 55 2.4.4形成切分词图 62 2.4.5数据基础 64 2.4.6改进一元模型 75 2.4.7二元词典 79 2.4.8完全二叉树组 85 2.4.9三元词典 89 2.4.10N元模型 90 2.4.11N元分词 91 2.4.12生成语言模型 99 2.4.13评估语言模型 100 2.4.14概率分词的流程与结构 101 2.4.15可变长N元分词 102 2.4.16条件随机场 103 2.5新词发现 103 2.5.1成词规则 109 2.6词性标注 109 2.6.1数据基础 114 2.6.2隐马尔可夫模型 115 2.6.3存储数据 124 2.6.4统计数据 131 2.6.5整合切分与词性标注 133 2.6.6大词表 138 2.6.7词性序列 138 2.6.8基于转换的错误学习方法 138 2.6.9条件随机场 141 2.7词类模型 142 2.8未登录词识别 144 2.8.1未登录人名 144 2.8.2提取候选人名 145 2.8.3最长人名切分 153 2.8.4一元概率人名切分 153 2.8.5二元概率人名切分 156 2.8.6未登录地名 159 2.8.7未登录企业名 160 2.9平滑算法 160 2.10机器学习的方法 164 2.10.1最大熵 165 2.10.2条件随机场 170 2.11有限状态机 171 2.12地名切分 178 2.12.1识别未登录地名 179 2.12.2整体流程 185 2.13企业名切分 187 2.13.1识别未登录词 188 2.13.2整体流程 190 2.14结果评测 190 2.15本章小结 191 2.16专业术语 193 第3章 英文分析 194 3.1分词 194 3.1.1句子切分 194 3.1.2识别未登录串 197 3.1.3切分边界 198 3.2词性标注 199 3.3重点词汇 202 3.4句子时态 203 3.5本章小结 204 第4章 依存文法分析 205 4.1句法分析树 205 4.2依存文法 211 4.2.1中文依存文法 211 4.2.2英文依存文法 220 4.2.3生成依存树 232 4.2.4遍历 235 4.2.5机器学习的方法 237 4.3小结 237 4.4专业术语 238 第5章 文档排重 239 5.1相似度计算 239 5.1.1夹角余弦 239 5.1.2最长公共子串 242 5.1.3同义词替换 246 5.1.4地名相似度 248 5.1.5企业名相似度 251 5.2文档排重 251 5.2.1关键词排重 251 5.2.2SimHash 254 5.2.3分布式文档排重 268 5.2.4使用文本排重 269 5.3在搜索引擎中使用文本排重 269 5.4本章小结 270 5.5专业术语 270 第6章 信息提取 271 6.1指代消解 271 6.2中文关键词提取 273 6.2.1关键词提取的基本方法 273 6.2.2HITS算法应用于关键词提取 275 6.2.3从网页中提取关键词 277 6.3信息提取 278 6.3.1提取联系方式 280 6.3.2从互联网提取信息 281 6.3.3提取地名 282 6.4拼写纠错 283 6.4.1模糊匹配问题 285 6.4.2正确词表 296 6.4.3英文拼写检查 298 6.4.4中文拼写检查 300 6.5输入提示 302 6.6本章小结 303 6.7专业术语 303 第7章 自动摘要 304 7.1自动摘要技术 305 7.1.1英文文本摘要 307 7.1.2中文文本摘要 309 7.1.3基于篇章结构的自动摘要 314 7.1.4句子压缩 314 7.2指代消解 314 7.3Lucene中的动态摘要 314 7.4本章小结 317 7.5专业术语 318 第8章 文本分类 319 8.1地名分类 321 8.2错误类型分类 321 8.3特征提取 322 8.4关键词加权法 326 8.5朴素贝叶斯 330 8.6贝叶斯文本分类 336 8.7支持向量机 336 8.7.1多级分类 345 8.7.2规则方法 347 8.7.3网页分类 350 8.8最大熵 351 8.9信息审查 352 8.10文本聚类 353 8.10.1K均值聚类方法 353 8.10.2K均值实现 355 8.10.3深入理解DBScan算法 359 8.10.4使用DBScan算法聚类实例 361 8.11本章小结 363 8.12专业术语 363 第9章 文本倾向性分析 364 9.1确定词语的褒贬倾向 367 9.2实现情感识别 368 9.3本章小结 372 9.4专业术语 373 第10章 问答系统 374 10.1问答系统的结构 375 10.1.1提取问答对 376 10.1.2等价问题 376 10.2问句分析 377 10.2.1问题类型 377 10.2.2句型 381 10.2.3业务类型 381 10.2.4依存树 381 10.2.5指代消解 383 10.2.6二元关系 383 10.2.7逻辑表示 386 10.2.8问句模板 386 10.2.9结构化问句模板 389 10.2.10检索方式 390 10.2.11问题重写 395 10.2.12提取事实 395 10.2.13验证答案 398 10.2.14无答案的处理 398 10.3知识库 398 10.4聊天机器人 399 10.4.1交互式问答 401 10.4.2垂直领域问答系统 402 10.4.3语料库 405 10.4.4客户端 405 10.5自然语言生成 405 10.6依存句法 406 10.7提取同义词 410 10.7.1流程 410 10.8本章小结 411 10.9术语表 412 第11章 语音识别 413 11.1总体结构 414 11.1.1识别中文 416 11.1.2自动问答 417 11.2语音库 418 11.3语音合成 419 11.3.1归一化 420 11.4语音 420 11.4.1标注 424 11.4.2相似度 424 11.5Sphinx 424 11.5.1中文训练集 426 11.6Julius 429 11.7本章小结 429 11.8术语表 429 参考资源 430 后记 431

自然语言处理原理与技术实现.pdf"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 不经沧桑怎成男人
  • 忘记是黑是白
  • 沼泽惊魂
  • 只是戏一场、
  • 風格自持
  • 凡事清韵
  • 冒牌淑女
  • 收穫
  • 温润如酒
  • 空有一身傲骨
  • 青澜饮舟
  • 发梢的风
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!