-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
大数据应用与技术丛书:数据挖掘与预测分析(第2版) 版权信息
- ISBN:9787302459873
- 条形码:9787302459873 ; 978-7-302-45987-3
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>>
大数据应用与技术丛书:数据挖掘与预测分析(第2版) 内容简介
《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。 《数据挖掘与预测分析(第2版)》的新内容: 添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本.效益分析、缺失数据填补、聚类优劣度量以及细分模型等。 针对前沿主题的新章节,例如,多元分类模型、BIRCH聚类、集成学习(bagging及boosting)、模型投票与趋向平均等。 每章节后均附有R语言开发园地,读者可以获得完成书中分析所需的R语言源代码,以及通过R代码生成的图、表和结果。 书中的附录为那些对统计基础生疏的读者提供了了解基本概念的材料。 超过750个章节练习,使读者能够自己测试对所学知识的掌握程度,并着手开展数据挖掘与预测分析工作。 《数据挖掘与预测分析(第2版)》将对数据分析人员、数据库分析人员以及CIO具有极大的吸引力,通过学习将使他们知道何种类型的分析将会增加其投资回报。
大数据应用与技术丛书:数据挖掘与预测分析(第2版) 目录
第1章 数据挖掘与预测分析概述
1.1 什么是数据挖掘和预测分析
1.2 需求:数据挖掘技术人员
1.3 数据挖掘离不开人的参与
1.4 跨行业数据挖掘标准过程:CRJSP-DM
1.5 数据挖掘的谬误
1.6 数据挖掘能够完成的任务
1.6.1 描述
1.6.2 评估
1.6.3 预测
1.6.4 分类
1.6.5 聚类
1.6.6 关联
R语言开发园地
R参考文献
练习
第2章 数据预处理
2.1 需要预处理数据的原因
2.2 数据清理
2.3 处理缺失数据
2.4 识别错误分类
2.5 识别离群值的图形方法
2.6 中心和散布度量
2.7 数据变换
2.8 min-max规范化
2.9 Z-score标准化
2.10 小数定标规范化
2.11 变换为正态数据
2.12 识别离群值的数值方法
2.13 标志变量
2.14 将分类变量转换为数值变量
2.15 数值变量分箱
2.16 对分类变量重新划分类别
2.17 添加索引字段
2.18 删除无用变量
2.19 可能不应该删除的变量
2.20 删除重复记录
2.21 ID字段简述
R语言开发园地
R参考文献
练习
第3章 探索性数据分析
3.1 假设检验与探索性数据分析
3.2 了解数据集
3.3 探索分类变量
3.4 探索数值变量
3.5 探索多元关系
3.6 选择感兴趣的数据子集作进一步研究
3.7 使用EDA发现异常字段
3.8 基于预测值分级
3.9 派生新变量:标志变量
3.10 派生新变量:数值变量
3.11 使用EDA探测相关联的预测变量
3.12 EDA概述
R语言开发园地
R参考文献
练习
第4章 降维方法
4.1 数据挖掘中降维的必要性
4.2 主成分分析
4.3 将主成分分析应用于房屋数据集
4.4 应提取多少个主成分
4.4.1 特征值标准
4.4.2 解释变异的比例标准
4.4.3 *小共性标准
4.4.4 坡度图标准
4.5 主成分描述
4.6 共性
4.7 主成分验证
4.8 因子分析法
4.9 因子分析法在成年人数据集中的应用
4.10 因子旋转
4.11 用户自定义合成
4.12 用户自定义合成的示例
R语言开发园地
R参考文献
练习
……
第Ⅱ部分 统计分析
第Ⅲ部分 分类
第Ⅳ部分 聚类
第Ⅴ部分 关联规则
第Ⅵ部分 增强模型性能
第Ⅶ部分 更多主题
第Ⅷ部分 案例研究:对直邮营销的响应预测
附录A 数据汇总与可视化
大数据应用与技术丛书:数据挖掘与预测分析(第2版) 作者简介
Daniel T.Larose,博士,美国中央康涅狄格州立大学数学科学教授,数据挖掘项目负责人。已出版与数据挖掘、Web挖掘和统计理论等相关论著多本。他也是《微软》、《福布斯》杂志以及《经济学人》杂志等数据挖掘与统计分析领域的顾问。 Chantal D.Larose,美国康涅狄格大学的在读博士。其研究领域包括缺失数据填补以及基于模型的聚类等。她已获得美国新帕尔兹纽约州立大学商学院决策科学领域助理教授的职位。
-
一本书读懂大数据
¥13.5¥36 -
4.23文创礼盒A款--“作家言我精神状态”
¥42.3¥206 -
4.23文创礼盒B款--“作家言我精神状态”
¥42.3¥206 -
一句顶一万句 (印签版)
¥40.4¥68 -
百年书评史散论
¥14.9¥38 -
1980年代:小说六记
¥52.8¥69