循序渐进学Spark在线阅读
会员

循序渐进学Spark

小象学院 杨磊
开会员,本书免费读 >

计算机网络数据库9.4万字

更新时间:2019-01-04 20:18:55 最新章节:8.7 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以小象学院git项目方式管理。感谢姜冰钰、陈超、冼茂源等每一位内容贡献者,感谢他们花费大量时间,将自己对Spark的理解加上在实际工作、学习过程中的体会,融汇成丰富的内容。与企业不断涌现的对大数据技术的需求相比,大数据人才还存在很大缺口,对大数据技术充满期许的新人正在源源不断地加入这个领域。在小象学院的教学实践过程中,我们发现,一本能完整系统地介绍Spark各模块原理并兼顾使用实战的书,对于初入大数据领域的技术人员至关重要。于是,我们根据日常积累的经验,著成本书。
品牌:机械工业出版社
上架时间:2017-04-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

小象学院 杨磊
主页

最新上架

  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字

同类书籍最近更新

  • 会员
    本书以数据流上的频繁模式和高效用模式挖掘计算为背景,介绍该领域相关的概念、理论及近年来相关的最新研究成果,内容包括传统数据集中的频繁模式挖掘及其大数据集下的频繁模式挖掘算法、不确定数据流中的频繁模式挖掘算法、具有效用值的数据流中的高效用模式挖掘算法。
    王乐数据库5.7万字
  • 会员
    本书分为25章,包括SQLServer2008的最基本、最常用、最重要的知识,同时通过贯穿全文的实例使读者更易、更快地掌握各章的知识点,最后通过实际应用中的完整实例让读者顺利地将所学理论知识运用到实际工作中去。全书内容由浅入深,并辅以大量的实例说明,使读者能更快、更好地掌握SQLServer2008。本书可供初学者作为入门书籍,也可为有一定的SQLServer编程基础的程序员作为参考用书
    希赛IT发展研究中心组编数据库28.4万字
  • 会员
    DataAnalysiswithPythonoffersamodernapproachtodataanalysissothatyoucanworkwiththelatestandmostpowerfulPythontools,AItechniques,andopensourcelibraries.IndustryexpertDavid
    David Taieb数据库8.9万字
  • 会员
    本书以在数字化背景下,数据产品从业者的数据技术、数据技能、数据思维、数据方法、数据模型、产品用户/客户增长实战经验为基调,体系化撰写了数字化和数据产品的数据经验知识和案例。随书附赠丰富的原始数据和源代码,方便读者对数据分析案例进行实操练习。本书内容全面,结构完整。首先,讲解了数据指标体系搭建和数据埋点案例;然后按照细节讲解数据分析流程、数据采集方法、数据挖掘整体方法;紧接着通过实操案例讲解了的数据
    连诗路编著数据库25.9万字
  • 会员
    本书从理论与实际应用相结合的角度出发,介绍数据库系统的原理知识与技术应用方法,包括数据库系统概述、关系数据模型、SQL数据库操作语言、数据库设计、数据库管理、数据库应用编程,以及分布式NoSQL数据库技术等内容。
    陆鑫 张凤荔 陈安龙数据库21.1万字
  • 会员
    本书由多位数据库技术专家和爱好者合著而成,集合了各行业dba的工作经验与思考,包含了精心挑选的数据库诊断案例与数据库恢复实践。内容涉及oracle典型错误的分析和诊断,oracle600内部错误的外理和解决,优化器与sql的行为与分析,以及很多内部深入技术的实践。本书的主要内容以原理分析、内容实践、故障解决为依据,将oracle数据库的深层技术层剖缕析抽丝剥茧地展示给读者。希望能够帮助读者加深
    盖国强 杨廷琨主编数据库15.3万字