分类: Bigdata

18 篇文章

thumbnail
spark RDD
RDD简介 RDD,全称为Resilient Distributed Datasets(弹性分布式数…
thumbnail
spark算子
Spark的算子的分类 从大方向来说,Spark 算子大致可以分为以下两类:   &nbs…
thumbnail
impala简介
apache impala 什么是Impala? Impala是用于处理存储在Hadoop集群中的大…
thumbnail
Hbase 整理
Hbase简介 HBase是一个开源的非关系型分布式数据库( NoSQL),它参考了谷歌的BigTa…
thumbnail
spark知识整理
什么是spark? Spark是基于内存计算大数据分析引擎,提高了在大数据环境下数据处理的实时性。S…