小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了olap和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研
本书从基础、设计和实现三个层面介绍数据库处理技术,内容全面翔实,既包括数据库设计、数据库实现、多用户数据处理、数据访问标准等经典理论,也包括商务智能、XML和 .NET等最新技术。 本书的内容编排和写作风格新颖,强调学习过程中的乐趣,围绕两个贯穿全书的项目练习,让读者从一开始就能把所学的知识用于解决具体的应用实例。 本书每章都有丰富的习题,可作为高等学校本科生或研究生的数据库课程教材,同时也是很好的专业参考书籍...
本书比较系统地介绍数据仓库与数据挖掘的理论体系和应用。本书总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。本书强调数据仓库和数
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而最好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实
商业智能是将企事业单位积累的数据转化为知识,帮助企事业单位做出科学决策的工具。蔡颖、鲍立威编著的《商业智能原理与应用》以“ 商业智能”应用为主线,全面系统地介绍了商业智能的基本概念、方法和技术,克服了以“数据挖掘” 技术为丰线的局限性,并以ms sql server作为数据仓库管理平台,以sql server business intelligence developrnent visual studio作为商业智能开发平台,进行
本书以emba班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大
本书全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理
现今市面上已经有书籍全面地介绍数据挖掘的技术理论基础,详细解析各种挖掘算法的原理和细节。同时,还有书籍专门介绍各种数据挖掘算法的实现和相关工作的使用。但这些书侧重于介绍单个数据挖掘功能及相关算法原理,并没有涉及如何将数据挖掘应用到具体实践,本书填补了这个空白。对每个案例都有详细的解析,全面介绍了如何将一个实际问题抽象和转化为数据挖掘的问题,然后利用数据挖掘的理论和方法加以解决,让读者明白来龙去脉。目的是切实指导数据挖掘的应用实践,建立
全书从5个方面讲述大数据时代下的金融数据挖掘方法:1)数据挖掘方法;2)银行数据挖掘篇,介绍了基于神经网络和支持向量机的信用评分方法;3)证券数据挖掘,探讨了基于多种数据挖掘方法的股票价格预测、金融市场价格预测及股票自动交易系统;4)保险及其他数据挖掘,研究了基于数据挖掘的保险欺诈监测、企业破产预测、财务报表欺诈监测等问题;5)从大数据的视角对金融数据挖掘进行了扩展和展望。 本书适合对数据挖掘算法感兴趣的计算机专业人
《数据挖掘算法与Clementine实践》主要介绍了几种最成熟的数据挖掘方法,并针对每种方法,,介绍了应用最广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、c5.o、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA
不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在 2012 年突然火爆起来的词汇,我们究竟该如何解读?本书介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革...
数据挖掘技术,又称为数据库知识发现,是20世纪90年代在信息技术领域开始迅速发展起来的计算机技术。作者结合自己近20年从事人工智能、机器学习、数据挖掘等方面的科研工作积累与教学经验,编著此书。 本书较全面系统地介绍了数据挖掘中常用和常见的数据挖掘方法,以及文本与视频数据挖掘方法。 本书的主要内容包括:数据挖掘基本知识、数据挖掘预处理方法、决策树分类及其他分类方法、关联知识挖掘方法、各种聚类分析方法,以及文本挖掘所涉及表示、
本书讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。本书还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。 本书可作为技术研究人员,使用技术成果的分析
本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。简祯富、许嘉裕编著的《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。全
随着大数据分析方法的发展,分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,可以轻松地探索大数据,挖掘大数据的价值。 本书侧重介绍大数据分析方法和算法的应用,适合对大数据分析感兴趣的读者阅读。在内容的组织上,选取了10个不同领域的真实数据集,针对每个数据的特点,选择适合的方法和算法,和读者一起体验数据探索、数据分析、建模预测的过程;通过实例计算的结果,读者会更加了解各种方法和算法的
本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、唯一约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。 为零基础r语言与数据挖掘教学和自学量身打造,系统讲解r语言与数据挖掘的必备知识,配有大量的上机实
数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过开源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考emc proven profess
华为存储首席架构师诚意之作 揭示了存储技术变革的脉...
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
(1)以太坊创始人、首席科学家Vitalik Buterin倾力推荐,工业界与学术界区块链专家联合撰写,系统性和实用性毋庸置疑 (2)深入剖析以太坊架构、核心部件、智能合约编写与开发案例等关键技术,并涵盖以太坊数据分析、性能优化、隐私与数据安全等前沿实践与进展...
《大数据时代的统计学思维:让你从众多数据中找到真相》是一本大数据时代下统计学思维和大数据分析的科普书籍,是一本了解大数据时代统计学思维和数据分析基本原理和方法的入门图书,是大数据时代每个人都需要了解的统计学基础理论、数据分析基本原理的入门图书。 《大数据时代的统计学思维:让你从众多数据中找到真相》结合30多个现实生活中的实例,介绍大数据时代下10多种常用的分析方法和基本原理,让你学会在众多数据中找到真相,而不被大量数据所欺骗,理论联系
人文社会科学和自然科学研究过程中积累了大量的研究数据,这些数据如何管理、共享、出版和引证?如何再次利用他人的数据?过程中牵涉到哪些知识产权?本书的几位作者不仅熟悉全球尤其欧美的研究数据管理的实践应用,而且在英国数据档案馆拥有多年数据相关专业工作的管理与实践经验,他们在本书中将多年积累的**数据管理实践建议、指导和培训倾囊呈现。本书前三章对研究数据管理和共享进行总括介绍,包括管理和共享的重要性、研究数据生命周期以及如何制订研究数据管理计
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。 本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书...
本书分为三篇。第壹篇:从整体上给出数据大图和数据平台大图,主要介绍数据的主要流程、各个流程的关键技术、数据的主要从业者及他们的职责等;数据平台大图分离线和实时分别给出数据平台架构、关键数据概念和技术等;第二篇:介绍离线数据开发的主要技术,包含Hadoop、Hive、维度建模等,另外此部分还将综合上述各种离线技术给出离线数据处理实战;第三篇:集中介绍实时数据处理的各项技术,包含Storm、SparkSteaming、Flink、Beam
2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有odps很大的功劳! 阿里巴巴集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台odps完成,odps为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提
本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分8章,主要内容包括Weka介绍、Explorer界面、Knowledge Flow界面、Experimenter界面、命令行界面、Weka高级应用、Weka API和学习方案源代码分析。 作为国内第一本系统讲解Weka的书籍,本书内容全面、实例丰富、可操作性强,做到理论与实
《推荐系统》全面阐述了开发最先进推荐系统的方法,其中呈现了许多经典算法,并讨论了如何衡量推荐系统的有效性。书中内容分为基本概念和最新进展两部分:前者涉及协同推荐、基于内容的推荐、基于知识的推荐、混合推荐方法,推荐系统的解释、评估推荐系统和实例分析;后者包括针对推荐系统的攻
《汇计划在行动》全面介绍了《上海市推进大数据研究与发展三年行动计划(2013-2015年)》的编制和实施过程。系统介绍了对大数据概念、内涵、技术和应用方面的认识,介绍了在上海信息化建设的基础和现状之上,如何让大数据在上海落地,并着力解决大数据应用过程中的关键问题,开展数据科学前瞻研究和人才培养;对三年行动计划进行了全面解读。《汇计划在行动》还介绍了“上海大数据产业技术创新战略联盟”发起、组建、运行方面的情况;介绍了“上海市数据科学重点
本书主要内容包括绪论、线性表、栈和队列、串、数组、树形结构、图、内部排序、查找。教材中对各类数据结构的分析按照“逻辑结构-存储结构-基本运算的实现-时空性分析-实例”的顺序进行讲述, 结构规范, 条理清晰。书中给出的程序和算法都是经过仔细筛选的经典内容, 便于读者理解和掌握, 程序采用C语言描述并容易调试通过 ; 每章有重点介绍和总结, 总结对重要的知识点进行穿线, 每章后针对本章重要知识点配有大量习题...
《企业级大数据平台构建:架构与实现》是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域工作超过20000小时的经验总结。作者朱凯从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,大家一定能找到灵感和思路来应对实际工作中面对的问题。本书在逻辑上分为三大部分:背景篇(靠前~2章):简单阐述了企业级大数据平台的重要性,并指出了作为一个企业
r是一种用于统计计算与做图的开源软件,同时也是一种编程语言,它广泛应用于企业和学术界的数据分析领域,正在成为最通用的语言之一。由于近几年数据挖掘、大数据等概念的走红,r也越来越多地被人关注。截至本文完成之日,cran(http://cran.r-project.org/)上共有4383个包,涉及统计、化学、经济、生物、医学、心理、社会学等各个学科。不同类型的公司,比如google、辉瑞、默克、美国银行、洲际酒店集团和壳牌公司都在
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。数据可视化技术希望将数据库中的数据项作为单个图元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。数据可视化是关于数据视觉化表现形式的科学
实用的python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本...
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分
适读人群 :想全面学习wireshark的初学者、网络管理员、渗透测试人员、网络安全专家、网络数据分析人士 通过80个实例,详细讲解了wireshark数据包分析实施的8大类技巧 基于wireshark抓取的数据包,层层剥茧地剖析了12种常见网络协议的构成 全面涵盖wireshark基础知识和应用技巧,以及使用wireshark对网络协议进行分析 遵循规范,从专业的角度循序渐进地讲解了wireshark抓包及分析的实施流程 针对海量数
《城市发展的数据逻辑》系统、全面地介绍了与城市发展有关的各种空间数据。在此基础上介绍了国内外对城市生产的研究现状,总结了目前国内外城市大数据研究的形成和发展、城市生长模型及其新方法,并借助一些典型案例,介绍应用城市生长技术的流程与方法。《城市发展的数据逻辑》还介绍了GIS、RS、GPS等新技术在城市发展及城市规划中的应用,以及如何使用新的信息技术方法揭示城市发展过程中诸如道路交通、城市建筑、公共设施等城市因子与城市发展的内生联系...
本书的原创性在于:提出并研究给出了大数据智慧计算原理与方法,具体又提出并研究给出了跳板大数据智慧计算原理与方法、耦合大数据智慧计算原理与方法、先验大数据智慧计算原理与方法、自适应云计算的原理与方法、增量大数据智慧计算原理与方法、自动大数据智慧计算原理与方法、分治大数据智慧计算原理与方法、冗余大数据智慧计算原理与方法...
本书共16章,共三篇。基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具MATALB进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过
spark开发者出品! 《spark快速大数据分析》是一本为spark初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于spark的用法,它对spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。 本书介绍了开源集群计算系统apache spark,它可以加速数据分析的实现和运行。利用spark,你可以用python、java以及scala的简易api来快速操控大规
开源、高性能,针对当前最热门的nosql数据库 注重理论实践,深入剖析mongodb存储原理与应用 提炼经典案例,深刻把握大数据应用开发技巧 注重实践,中兴、华为等公司多年一线数据库存储、部署开发经验的总结。 注重效率,用最精简的篇幅直接阐明问题的本质,节省宝贵的阅读时间。 注重基础,用计算机领域相关的基础理论知识来解释某些难于理解的概念。 案例丰富,使用完整的例子与代码注释,使读者可以直接上手操作。 把握
本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。内容包括: 绪论、体系结构概要、预备域等...
《网站数据挖掘与分析:系统方法与商业实践》 在线数据分析领域巨擘webtrekk官方资深数据分析专家撰写,目前最具系统性、深度和商业指导价值的web数据挖掘与分析专著; 技术层面,系统讲解网站数据分析的各种指标、工具、技术和方法;应用层面,通过10余个商业案例还原真实的数据分析场景;管理层面,深入探讨如何进行数据风险、数据质量、数据投入和产出、数据流程和落地管理...
思科在2013年末推出了aci解决方案,以从应用出发的视角构建企业级数据中心网络,通过开源开放的方式来包容云化的基础架构资源,更重要的是具化网络与应用、与业务之间的关联,从而凸显网络对于企业的价值。当然,天下没有免费的午餐,企业网络从业人员需要用全新的视角来审视自身的工作,从枯燥的网络协议和命令行中抬起头来,更多地去理解企业应用和背后的技术架构,从思考“how:怎么实现”到更多思考“why what:为什么实现??实现什么”。
本书源自作者在斯坦福大学教授的“海量数据挖掘”(cs246: mining massive datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。 众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍
《云时代的流式大数据挖掘服务平台:基于元建模的视角》可供相关领域的研究人员参考,也可以作为高等院校信息技术专业高年级本科生和研究生的教材...
这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值...
网店的运营有其自身的规律和特点,仅有好商品和低价格还远远不够,如果不懂得分析市场、不懂得选择款式、不懂得引流推广、不懂得数据分析、不懂得页面设计,纵然是经营经验丰富的实体店卖家,也会在触网后遭遇水土不服。本书正是为了系统解决网店运营方方面面的问题而编写的。书中几乎每一个小节都可以看成是网店运营的一个问题解决方案,几十个方案汇集在一起就成了一本网店运营宝典,为卖家的电商之路保驾护航。 此外,还赠送超值学习大礼包: 1. 网店管理与运营教
hadoop是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的hadoop(cdh5,apache hadoop 2.6)版本介绍hadoop技术的相关知识,不但详细介绍了hadoop、hdfs、yarn、mapreduce、hive、sqoop和hbase等,还深入探讨了hadoop、hbase的运维和性能调优,并包含了一个具有代表性的完整的基于hadoop的商业智能系统的设计和实现。 本书的大特点是
[日]熊田千佳慕著,张勇译
泰戈尔
(美)艾玛·克莱因(EmmaCline
梁实秋
刘争争
汪曾祺
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071