中图网

>

计算机教材

R语言数据分析与挖掘

作者：陈维主编

出版社：西安电子科技大学出版社出版时间：2020-08-01

开本： 23cm 页数： 162页

本类榜单：计算机/网络销量榜

预估到手价¥18.2(7.6折)?

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格（不含优惠券部分），仅供参考，未必等同于实际到手价。

中图价:¥20.2(8.4折)定价 ~~¥24.0~~ 登录后可看到会员价

促销活动:

年中庆第一波|全场百万图书折上9折

加入购物车收藏

运费6元，全场折上9折期间 满39元包邮

?快递不能达地区使用邮政小包，运费14元起

云南、广西、海南、新疆、青海、西藏六省，部分地区快递不可达

本类五星书更多>

>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

¥11.3¥45
>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥28.2¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥55.2¥69
>
第一行代码Android

第一行代码Android

¥76.2¥99
>
C Primer Plus 第6版中文版

C Primer Plus 第6版中文版

¥75.6¥108
>
深度学习

深度学习

¥82.3¥168
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

¥43.5¥79

商品详情
商品评论(0条)

中图价:¥20.2 加入购物车

版权信息
内容简介
目录

微信公众号

R语言数据分析与挖掘版权信息

ISBN：9787560657905
条形码：9787560657905 ; 978-7-5606-5790-5
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
计算机教材

R语言数据分析与挖掘内容简介

现在，越来越多的人考虑引入大数据技术来促进公司产品的销售以获得更多的利润。而学习算法能让商务活动及其发展过程的预测摆脱人脑计算能力的局限，并且能提高数据模型的预测精确度，使得大数据的分析处理在依托计算机的大规模计算能力下得以完成。当前数据分析*常用的工具就是R语言，本书深入浅出地介绍了利用R语言进行数据分析及构建预测模型的多种实用方法，包括回归、聚类、关联和分类分析等常用学习算法的实现，每一种算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。本书还系统讲解了相关的R语言的基础知识，包括环境准备以及数据转换、分析和结果可视化的方法等。本书融合了作者十几年来利用数据分析算法来实现数据挖掘与分析的诸多心得，书中所有的源代码和实验数据以及习题和答案在出版社网站上都可以免费下载。阅读完本书并亲自动手完成书中所有算法案例后，读者对数据分析将会有更深入的了解。本书既可以作为相关专业数据分析类课程的教材，也可以作为大数据网络培训或技术人员自学的参考资料。

R语言数据分析与挖掘目录

第1章初识数据分析与R语言 1 1.1 软件下载与安装 1 1.1.1 下载和安装 1 1.1.2 下载和安装RStudio 3 1.2 包的安装和加载 5 1.3 应用R实现数据操作 6 1.3.1 数据读写 6 1.3.2 数据基本操作 8 1.3.3 应用简单统计 11 1.3.4 数据可视化 14 习题 17 第2章回归分析 18 2.1 简单线性回归分析 18 2.1.1 调用lm函数构建简单线性回归模型 18 2.1.2 输出线性模型的特征信息 20 2.1.3 使用线性回归模型预测未知数 21 2.1.4 生成模型的诊断图 22 2.2 多项式回归分析 23 2.2.1 利用lm函数生成多项式回归模型 23 2.2.2 调用rlm函数生成稳健线性回归模型 25 2.3 在SLID数据集上研究线性回归案例 27 习题 33 第3章关联分析 35 3.1 关联分析的准备工作 35 3.1.1 将数据转换成事务数据 35 3.1.2 展示事务及其关联 37 3.2 Apriori规则 39 3.2.1 使用Apriori规则完成关联挖掘 39 3.2.2 去掉冗余规则 42 3.3 关联规则可视化 43 3.4 Eclat挖掘 45 3.4.1 使用Eclat挖掘频繁项集 45 3.4.2 生成时态事务数据 47 3.5 使用cSPADE挖掘频繁时序模式 49 习题 52 第4章聚类分析 53 4.1 层次聚类 53 4.1.1 使用层次聚类处理数据 53 4.1.2 将树分成簇 56 4.2 k均值聚类 57 4.2.1 使用k均值方法处理数据 57 4.2.2 绘制二元聚类图 59 4.3 聚类算法比较 61 4.4 聚类效果评估 62 4.4.1 从簇中抽取轮廓信息 62 4.4.2 获得优化的k值聚类 64 4.5 使用密度聚类方法处理数据 65 习题 68 第5章决策树 69 5.1 准备训练和测试数据集 69 5.2 递归决策树 71 5.3 递归决策树可视化 73 5.4 评测递归分割树的预测能力 74 5.5 递归分割树剪枝 76 5.6 使用条件推理树建立分类模型 78 5.7 条件推理树可视化 79 5.8 评测条件推理树的预测能力 80 习题 82 第6章神经网络与支持向量机 83 6.1 支持向量机 83 6.1.1 使用支持向量机完成数据分类 83 6.1.2 选择支持向量机的惩罚因子 85 6.1.3 实现SVM模型的可视化 87 6.1.4 基于支持向量机训练模型实现类预测 89 6.1.5 调整支持向量机 90 6.2 神经网络 93 6.2.1 利用neuralnet包训练神经网络模型 93 6.2.2 可视化由neuralnet包得到的神经网络模型 96 6.2.3 基于neuralnet包得到的模型实现类标号预测 97 6.2.4 利用nnet包训练神经网络模型 99 6.2.5 基于nnet包得到的模型实现类标号预测 101 习题 102 第7章模型评估 103 7.1 k折交叉验证 103 7.1.1 基于k折交叉验证方法评测模型性能 103 7.1.2 利用e1071包完成交叉验证 104 7.1.3 利用caret包完成交叉检验 106 7.2 变量重要性排序 107 7.2.1 利用caret包对变量重要性程度排序 107 7.2.2 利用rminer包对变量重要程度排序 109 7.3 特征选择 110 7.3.1 利用caret包找到高度关联的特征 110 7.3.2 利用caret包选择特征 111 7.4 模型的性能评估 115 7.4.1 评测回归模型的性能 115 7.4.2 利用混淆矩阵评测模型的预测能力 118 7.4.3 利用ROCR评测模型的预测能力 119 7.4.4 利用caret包比较ROC曲线 120 7.4.5 利用caret包比较模型性能差异 123 习题 125 附录习题库 126 参考文献 162

展开全部

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐