4.23文创礼盒,买2个减5元 读书月福利
欢迎光临中图网 请 | 注册
> >
数据科学实践(数据科学与大数据技术丛书)

数据科学实践(数据科学与大数据技术丛书)

出版社:中国人民大学出版社出版时间:2023-01-01
开本: 其他 页数: 196
中 图 价:¥30.2(7.2折) 定价  ¥42.0 登录后可看到会员价
加入购物车 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

数据科学实践(数据科学与大数据技术丛书) 版权信息

  • ISBN:9787300311463
  • 条形码:9787300311463 ; 978-7-300-31146-3
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

数据科学实践(数据科学与大数据技术丛书) 内容简介

本书内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。

数据科学实践(数据科学与大数据技术丛书) 目录

第1章 引言
1.1 数据科学与人工智能时代
1.2 数据智慧
1.3 本书内容安排

第2章 基础模型
2.1 机器学习方法
2.1.1 双向聚类
2.1.2 基于邻居的推荐算法
2.1.3 网络模型
2.2 深度学习
2.2.1 机器翻译模型
2.2.2 图像分析模型

第3章 音乐风格识别
3.1 背景介绍
3.2 方法简介
3.2.1 音频数据和音频特征
3.2.2 混合动力模型架构
3.3 描述分析
3.3.1 数据来源及简介
3.3.2 数据加工
3.3.3 音频特征提取
3.4 混合动力模型架构
3.4.1 两个基础模型的预测效果
3.4.2 混合动力模型架构的预测效果
3.4.3 工程优化

第4章 航空数据案例分析
4.1 数据简介
4.2 单机实现
4.2.1 基于Mysql的数据预处理
4.2.2 洛杉矶到波士顿航线的延误分析
4.2.3 机场聚类分析
4.2.4 *短路径
4.3 分布式实现
4.3.1 基于Hive的数据预处理
4.3.2 用Spark建立分类模型

第5章 公共自行车数据案例分析
5.1 数据简介
5.1.1 交易流水表
5.1.2 纽约市天气数据
5.2 单机实现
5.2.1 描述统计分析与可视化展现
5.2.2 自行车角度的分析
5.2.3 单个站点借车量预测分析
5.3 分布式实现
5.3.1 数据预处理与描述统计
5.3.2 分布式预测模型

第6章 机器翻译实例
6.1 数据简介与数据预处理
6.1.1 删除异常值
6.1.2 修改异常值及数据筛选
6.1.3 BPE分词
6.2 数据描述统计
6.2.1 句子长度统计
6.2.2 词频统计
6.2.3 词性统计
6.3 Seq2Seq+Attention模型
6.3.1 Seq2Seq模型介绍
6.3.2 模型训练过程
6.3.3 BLEU值计算原理
6.3.4 模型训练结果
6.4 Transformer模型
6.4.1 训练模型参数设置
6.4.2 训练结果
6.5 模型对比

第7章 眼底图像分析示例
7.1 数据简介
7.2 图像分割模型建立
7.2.1 数据预处理
7.2.2 模型训练
7.3 基于图像的智能诊断
7.3.1 图像分割结果
7.3.2 描述统计
7.3.3 诊断模型

参考文献
展开全部

数据科学实践(数据科学与大数据技术丛书) 作者简介

  吕晓玲,中国人民大学统计学院教授、数据科学与大数据统计系主任。研究方向:统计学习与数据科学、消费者行为分析、文本分析。    李舰,统计学本科、软件工程硕士、商学博士,数据科学应用领域的多年从业者,是“统计之都”社区的核心成员之一,也是一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《数据科学概论》《统计之美》等书。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服