Spark快速大数据分析（第2版）最新章节全文无弹窗在线阅读-QQ阅读女生幻言网

QQ阅读女频短篇网

女频短篇网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API，利用SparkSQL进行交互式查询，掌握Spark应用的优化之道，用Spark和DeltaLake等开源工具构建可靠的数据湖，并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本，本书第2版做了全面的更新，以体现Spark生态系统在机器学习、流处理技术等方面的发展，另新增一章详解Spark3.0引入的新特性。

品牌：人邮图书

译者：王道远

上架时间：2021-11-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)朱尔斯·S. 达米吉布鲁克·韦尼希丹尼·李 (印)泰瑟加塔·达斯

最新上架

会员
数据分析师手记：数据分析72个核心问题精解
《数据分析师手记：数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发，使用问答的形式对数据分析中的72个核心知识点进行讲解，构建了数据分析的知识框架，带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图，针对具体的方法、技术进行延伸学习。
刘林李朝成饼干哥哥计算机16.8万字
会员
MySQL从入门到精通（第3版）
《MySQL从入门到精通（第3版）》从初学者角度出发，通过通俗易懂的语言和丰富多彩的实例，详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章，包括数据库基础，初识MySQL，使用MySQL图形化管理工具，数据库操作，存储引擎及数据类型，数据表操作，MySQL基础，表数据的增、删、改操作，数据查询，常用函数，索引，视图，数据完整性约束，存储过程与存储函数，触发器，事务，事件，备份与恢
明日科技编著计算机14万字
会员
数字IC设计入门（微课视频版）
本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法，使其更加了解芯片行业的分工与动向。本书共分9个章节，从多角度透视芯片设计，特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验，针对IC新人关心的诸多问题，为其提供了提升个人能力，选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述，并解答了IC新人普遍关心的若干问题。
白栎旸编著计算机29.9万字
会员
数据分析咖哥十话：从思维到实践促进运营增长
本书以案例的形式，介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素，在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时，以问题为导向，解读运营与增长的关键性业务内容，在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包，适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
黄佳计算机12万字
会员
大数据SQL优化：原理与实践
这是一本站在一线开发人员的视角，从SQL的本质出发，采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式，深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员，期望帮大家深度理解大数据SQL优化原理，掌握SQL优化的落地实践方法，从而真正“玩转”大数据SQL优化技术，根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
陈鹤杨国栋计算机14万字
会员
企业级大数据项目实战：用户搜索行为分析系统从0到1
《企业级大数据项目实战：用户搜索行为分析系统从0到1》基于真实业务场景，以项目导向为主线，从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章，第1章讲解项目需求与架构设计，详细阐述项目数据流与系统架构；第2章介绍大数据项目开发环境配置，手把手带领读者配置操作系统、Hadoop集群与相关工具，为后续项目实施打下基础；第3～5章逐步实现项目需求，第3章讲解用户行为数据采集模块的开发
张伟洋计算机9万字
会员
PySpark大数据分析与应用
本书以Python作为开发语言，系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出，理论叙述循序渐进、由浅入深。本书共7章，第1？5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库，内容介绍注重理论与实践相结合，通过典型示例
戴刚张良均主编计算机10.4万字
会员
SQL Server从入门到精通（第5版）
《SQLServer从入门到精通（第5版）》从初学者角度出发，通过通俗易懂的语言、丰富多彩的实例，详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章，内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中
明日科技编著计算机14.1万字
会员
数据挖掘竞赛实战：方法与案例
本书围绕数据挖掘竞赛，讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧，并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始，介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉（图像）、计算机视觉（视频）、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇：理论篇介绍通用的解题流程和关键技术；实战篇选取比较有代表性的赛题，对赛题的优秀方案
许可乐编著计算机6.7万字

同类书籍最近更新

会员
OceanBase数据库源码解析
OceanBase作为当今最先进的分布式关系型数据库之一，在开源之后受到了业界的广泛关注。为了帮助数据库内核研发人员、科研工作者、数据库技术爱好者理解OceanBase内核，本书从OceanBase开源版的源代码出发，介绍其实现机制和技术细节。本书的主要内容包括：OceanBase概述、OceanBase的架构、OBServer、存储引擎、SQL引擎、事务引擎、高可用、多租户、安全管理等。本书尽可
彭煜玮杨传辉杨志丰编著数据库16.9万字
会员
云数据管理实战指南
本书从当下数据中心的主要系统应用场景出发，介绍如何使用适合云计算和大数据的灾备方式来实现数据保护。
魏磊张聪邬小亮等编著数据库11万字
会员
活用数据：驱动业务的数据分析实战
本书分为数据思维和案例解析两个部分，对“怎么想”和“怎么做”两大分析痛点问题进行剖析和解答。基于知先行后的考虑，前3章首先对“怎么想”的问题进行解答，通过明确分析问题、开启分析思路、打开分析视角，依次回答数据思维3个核心问题：解决什么问题？分析哪些内容？分析到何种程度？结合11个思维练习的案例，引导读者对业务需求进行思考，明确研究内容和分析方法。
陈哲数据库10.8万字
会员
Hadoop大数据技术开发实战
本书以Hadoop及其周边框架为主线，介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章，第1章讲解了VMware中CentOS7操作系统的安装；第2章讲解了大数据开发之前对操作系统集群环境的配置；第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm
张伟洋数据库14.6万字
会员
Data Mesh权威指南
本书介绍了数据网格——一种来自现代分布式架构的去中心化社会技术范式，它提供了一种大规模采购、共享、访问和管理分析型数据的新方法。本书分为五部分。第1部分介绍DataMesh的四个原则，以及它们所组成的高级模型。第二部分比较DataMesh与以前的数据架构的区别。第三部分介绍DataMesh组件的高层次架构，帮助你设计DataMesh架构以及评估与DataMesh匹配的现成技术。第四部分介绍Data
(澳)扎马克·德加尼数据库18.1万字
会员
高效自动化测试平台：设计与开发实战
高效测试平台的建设对软件自动化测试的效率有重大的意义。本书总结了高效测试平台的基本设计方法，包括面向对象设计思想、模块化设计、可扩展的弹性设计、测试设备的驱动设计、与CI/CD的结合，以及平台的部署。介绍了如何进行测试工具的选型、测试引擎的灵活配置，如何开发高复用性的测试用例，如何进行测试用例的生命周期管理等。此外，与平台相结合，深入探讨了数据驱动测试、事件驱动测试等测试脚本的设计模式、代码自动生
徐德晨茹炳晟数据库17.9万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 fwdebook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015