题目:(题号1622) 请你实现三个 API append,addAll 和 m…
RDD简介 RDD,全称为Resilient Distributed Datasets(弹性分布式数…
Spark的算子的分类 从大方向来说,Spark 算子大致可以分为以下两类: &nbs…
apache impala 什么是Impala? Impala是用于处理存储在Hadoop集群中的大…
最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完…
1.基本概念 核心对象:若某…
Hbase简介 HBase是一个开源的非关系型分布式数据库( NoSQL),它参考了谷歌的BigTa…
https://github.com/apache/atlas (github 拉取对应…
追寻事物本质应该是人类与生俱来的一种特性。看看我们在童年时向我们父母提出的那些啼笑皆非的问题,再想想…
生在一个最好的时代,也是一个最坏的时代。 一直都知道自己骨子里并不是一个墨守成规的人,通过一番努力获…