大数

触手可及的大数据分析工具:Tableau案例集

资源名称:触手可及的大数据分析工具 案例集 内容简介: 《触手可及的大数据分析工具: 案例集》对 的产品、优势、 的新特性及其功能做了全面的介绍,并且从 个不同行业的案例入手,让你在阅读本书后能够从一个新手成长为能够创建出复杂仪表板的高手。 《触手可及的大数据分析工具: 案例集》分为五个部分共 章: 使用概述、新手上路、成功晋级、高手秘籍以及实际应用。 使用概述包含四章,分别从为何要进行数据可视化、 的发展历程、 的产品介绍、 的新特性、 的应用优势以及如何利用 进行数据连接和了解工作区几个方面做了详尽的

大数据时代的算法:机器学习、人工智能及其典型实例

资源名称:大数据时代的算法:机器学习、人工智能及其典型实例 内容简介: 《大数据时代的算法:机器学习、人工智能及其典型实例》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。《大数据时代的算法:机器学习、人工智能及其典型实例》涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。 《大数据时代的算法:机器学习、人工智能及其典型

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

资源名称:数据算法: 大数据处理技巧 英文 原版 第 章二次排序:简介 第 章二次排序:详细示例 第 章 列表 第 章左外连接 第 章反转排序 第 章移动平均 第 章购物篮分析 第 章共同好友 第 章使用 实现推荐引擎 第 章基于内容的电影推荐 第 章使用马尔可夫模型的智能邮件营销 第 章 均值聚类 第 章 近邻 第 章朴素贝叶斯 第 章情感分析 第 章查找、统计和列出大图中的所有三角形 第 章 计数 第 章 测序 第 章 回归 第 章 趋势检验 第 章等位基因频率 第 章 检验 第 章皮尔逊相关系数 第

大数据分析:方法与应用

资源名称:大数据分析:方法与应用 内容简介: 本书介绍数据挖掘、统计学习和模式识别中与大数据分析相关的理论、方法及工具。理论学习的目标是使学生掌握复杂数据的分析与建模;方法学习的目标是使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,工具学习的目标是使学生熟练掌握一种数据分析的语言。本书内容由 章构成:大数据分析概述,数据挖掘流程,有指导的学习,无指导的学习,贝叶斯分类和因果学习,高维回归及变量选择,图模型,客户关系管理、社会网络分析、自然语言模型和文本挖掘。 本书可用做统计学、管理学、计算机科

大数据治理与安全从理论到开源实践

资源名称:大数据治理与安全从理论到开源实践 内容简介: 作为大数据前沿的新兴领域,市面上大数据安全与治理的相关书籍屈指可数。本书在介绍大数据学术界新动态与大数据行业生产实践的同时,对大数据安全与治理的新理论与实践内容做了详尽的阐述。本书分为两部分 第壹篇(理论篇 介绍大数据治理与安全的理论、方法和技术挑战等;第二篇 开源实现篇 ,介绍开源社区各类开源项目,将研究与实践的内容根据不同组件分类。 资源目录: 前 言 第一篇 理论篇 第 章 大数据治理技术  概述  大数据治理的基本概念  大数据治理的意义和重

大数据时代:生活、工作与思维的大变革 中文PDF

资源名称:大数据时代 生活、工作与思维的大变革 中文 第一部分大数据时代的思维变革 第 章更多:不是随机样本,而是全体数据 让数据 发声 小数据时代的随机采样,最少的数据获得最多的信息 全数据模式,样本 总体 第 章更杂:不是精确性,而是混杂性 允许不精确 大数据的简单算法比小数据的复杂算法更有效 纷繁的数据越多越好 混杂性,不是竭力避免,而是标准途径 新的数据库设计的诞生 第 章更好:不是因果关系,而是相关关系 关联物,预测的关键 是什么 ,而不是 为什么 改变,从操作方式开始 大数据,改变人类探索世界

大数据文档合集

教程名称:大数据文档合集 课程目录: 【 教程网】 , 大数据释放的新机会? 【 教程网】 与大数据:下一轮资本泡沫之源 【 教程网】大数据产业生态战略研究( 年) 【 教程网】大数据时代 先锋利器 数据仓库管理系统 【 教程网】大数据时代 王者之剑 企业挖掘系统 【 教程网】大数据时代数据领域未来发展的三大趋势 【 教程网】时间轴:大数据时代的 生死簿 【 教程网】王坚:云计算和大数据,你们都理解错了 【 教程网】电商角力传统银行业大数据控制权争夺升温 【 教程网】马云 金手指 点中大数据产业千亿市场最

企业大数据处理 Spark、Druid、Flume与Kafka应用实践 完整pdf

资源名称:企业大数据处理 、 、 与 应用实践 完整 第一部分 准备工作 第 章 基础环境准备 第二部分 核心技术 第 章  详解 第 章  原理及部署 第 章  数据摄入 第 章  客户端 第 章 日志收集 第 章 分布式消息队列 第三部分 项目实践 第 章 数据平台 第 章 监控系统 资源截图:

Python+Spark 2.0+Hadoop机器学习与大数据实战

资源名称: 机器学习与大数据实战 内容简介: 本书从浅显易懂的 大数据和机器学习 原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了 机器学习 内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机 系统上通过 虚拟机安装多机 虚拟机,如何建立 集群,再建立 开发环境。书中介绍搭建的上机实

Spark大数据处理技术 完整pdf

资源名称: 大数据处理技术 完整 第 章 系统概述 大数据处理框架 大数据处理框架 表达能力 子系统 小结 第 章 及编程接口 程序 分区( ) 优先位置( ) 依赖关系( ) 分区计算( ) 分区函数( ) 创建操作 集合创建操作 存储创建操作 转换操作 基本转换操作 键值 转换操作 再论 依赖关系 控制操作( ) 行动操作( ) 集合标量行动操作 存储行动操作 小结 第 章 运行模式及原理 运行模式概述 运行模式列表 基本工作流程 相关基本类 模式 部署及程序运行 内部实现原理 模式 部署及程序运行