《写给程序员的数据挖掘实践指南》
ebook书名:写给程序员的数据挖掘实践指南
作者:Ron Zacharski
出版社:人民邮电出版社
副标题:A Programmer's Guide to Data Mining
出版年:2015年
页数:400
格式:ebook
ISBN:9787115336354
内容简介:
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。大多数数据挖掘的教材都专注于介绍理论基础,因而往往难以理解和学习。本书是介绍写给程序员的一本数据挖掘指南,可以帮助读者动手实践进行数据挖掘、集体智慧并构建推荐系统。全书共8章,介绍了数据挖掘的基本知识和理论、协同过滤、内容过滤及分类、算法评估、朴素贝叶斯、非结构化文本分类以及聚类等内容。全书采用做中学的方式,用生动的图示、大量的表格、简明的公式,实用的Python代码示例,阐释数据挖掘的知识和技能。每章还给出了习题和练习,帮助读者巩固所学的知识。本书专注适合对数据挖掘、数据分析和推荐系统感兴趣的程序员及相关领域的从业者阅读参考;同时,本书也可以作为一本轻松有趣的数据挖掘课程教学参考书。作者简介:
Ron Zacharski是一名软件开发工程师,曾在威斯康辛大学获美术学士学位,之后还在明尼苏达大学获得了计算机科学博士学位。博士后期间,他在爱丁堡大学研究语言学。正是基于广博的学识,他不仅在新墨西哥州立大学的计算研究实验室工作,期间还接触过自然语言处理相关的项目,而该实验室曾被《连线》杂志评为机器翻译研究领域翘楚。除此之外,他还曾教授计算机科学、语言学、音乐等课程,是一名博学多才的科技达人。 王斌 博士,中国科学院信息工程研究所研究员,博士生导师,中国科学院大学兼职教授,研究方向为信息检索、自然语言处理与数据挖掘。主持国家973、863、国家自然科学基金、国际合作基金、部委及企业合作等课题近30项,发表学术论文130余篇,领导研制的多个系统上线使用,曾获国家科技进步二等奖和北京市科学技术二等奖各一项。现为中国中文信息学会理事、信息检索、社会媒体处理、语言与知识计算等多个专业委员会委员、《中文信息学报》编委、中国计算机学会高级会员及中文信息处理专业委员会委员。多次担任SIGIR、ACL、CIKM等会议的程序委员会委员。《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》、《机器学习实战》、《Mahout实战》译者。2006年起在中国科学院大学讲授《现代信息检索》研究生课程,累计选课人数已超过1500人。迄今培养博士、硕士研究生近40名。
目录:
内容提要
作译者简介
译者序
序
前言
第1章 数据挖掘简介及本书使用方法
第2章 协同过滤—爱你所爱
第3章 协同过滤—隐式评级及基于物品的过滤
第4章 内容过滤及分类—基于物品属性的过滤
第5章 分类的进一步探讨—算法评估及kNN
第6章 概率及朴素贝叶斯—朴素贝叶斯
第7章 朴素贝叶斯及文本—非结构化文本分类
第8章 聚类—群组发现
-
《蒙田随笔》电子书免费下载
蒙田是第一位敢于大胆剖析自我的哲学家,很多观念都远远超出了他所处的时代,就像一位活在16世纪的现代人。他对历史信手拈来,显示出惊人的阅读量;文字不拘一格,只写心中所想。本书蒙田的三卷《随笔集》中精选了十二篇,主题集中,话题广泛,包含剖析自身缺...
01月01日[文学]
-
《情节与人物》电子书免费下载
《创意写作书系:情节与人物·找到伟大小说的平衡点》主要讲述了,对于一个故事来说,什么更重要:吸引人的情节,还是鲜明的人物?文学导向的小说家强调以人物为基础,商业导向的小说家则强调以情节为基础。其实,小说在这两方面都很强。《创意写作书系:情节与...
01月01日[文学]
-
《庭审制胜》电子书免费下载
法庭上的辩论完全是一场真刀真枪的较量,要求律师不仅要具备雄厚的法学理论功底,而且在法庭上敢辩并善辩。由于辩护律师要随时从辩论中获取对案件有利的证据,并迅速做出反应,这对律师的应变能力、舌战技巧以及对法律条文的掌握都是一种严峻的考验。 在本书...
01月01日[生活]
-
《傲慢与偏见》电子书免费下载
《傲慢与偏见》是简·奥斯汀的代表作,是一部描写爱情与婚姻的经典小说。作品以男女主人公达西和伊丽莎白由于傲慢和偏见而产生的爱情纠葛为线索,共写了四起姻缘:伊丽莎白与达西、简与宾利、莉迪亚与威克姆、夏洛蒂与柯林斯。伊丽莎白、简和莉迪亚是贝内特家...
01月01日[生活]
-
《刀锋上的救赎》电子书免费下载
在这座熟悉的陌生城市里有人肆意掠夺生命他们伤害同类,以及他们可以伤害的一切但,受到伤害的不仅仅是这座城市追缉凶犯是我的使命我希望每一个罪犯都能得到应有的惩罚但我更是在追寻那个理由那个让我们可以放任自己互相伤害的理由刑警队长赵馨诚,刚猛血性,...
01月01日[流行]