大数

大数据Spark企业级实战

资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。   在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据

大数据真实案列分析《HadoopSpark企业应用实战》11月份班

资源名称:大数据真实案列分析《 企业应用实战》 月份班 教程内容: 授 课 对 象 商业智能( )和企业数据仓库( )的管理人员、建模人员、分析和开发人员、系统管理员等; 有意将 生态系统中的组件,作为现有 的补充,或未来替代产品的项目负责人及开发人员; 企业中牵涉到大数据处理的数据中心运行、规划、设计负责人; 企业级应用、整合项目的成员、负责人、开发人员 熟悉 生态系统,想了解和学习 与 整合在企业应用实战案例的朋友。 课 程 大 纲 本课程会介绍 各组件的架构,但不会涉及任何安装的内容,安装的教程、录

实战大数据

资源名称:实战大数据 内容简介: 数据是重要资产 已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共 章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例, 云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和

Python+Spark 2.0+Hadoop机器学习与大数据实战

资源名称: 机器学习与大数据实战 内容简介: 本书从浅显易懂的 大数据和机器学习 原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了 机器学习 内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机 系统上通过 虚拟机安装多机 虚拟机,如何建立 集群,再建立 开发环境。书中介绍搭建的上机实

Storm实战:构建大数据实时计算 带书签 完整PDF

资源名称: 实战 构建大数据实时计算 带书签 完整 第 章 基础 能做什么 特性 其他流计算系统 应用模式第 章 初体验 本地环境搭建 集群第 章 构建 基本概念 构建 小结第 章 的并行度 并行元素 配置并行度 一个运行中 的例子 如何更新运行中的 的并行度第 章 消息的可靠处理 简介 理解消息被完整处理 消息的生命周期 可靠相关的 高效地实现 选择合适的可靠性级别 集群的各级容错 小结第 章 一致性事务 简单设计一:强顺序流 简单设计二:强顺序 流 的原理 第 章 总体概述 本地模式 远程模式 一个复

Spark大数据分析实战 高彦杰 完整pdf

资源名称: 大数据分析实战 高彦杰 完整 第 章 简介 初识 生态系统 架构与运行逻辑 弹性分布式数据集 简介 算子分类 本章小结 第 章 开发与环境配置 应用开发环境配置 使用 开发 程序 使用 进行交互式数据分析 远程调试 程序 编译 配置 源码阅读环境 本章小结 第 章 简介 为什么使用 架构分析 简介 架构 原理剖析 简介 的使用简介 体系结构 简介 中的聚类和分类 本章小结 第 章 架构日志分析流水线 日志分析概述 日志分析指标 架构 构建日志分析数据流水线 用 进行日志采集 用 将日志汇总 用