thumbnail
leetcode 记录
题目:(题号1622) 请你实现三个 API append,addAll 和 m…
thumbnail
spark RDD
RDD简介 RDD,全称为Resilient Distributed Datasets(弹性分布式数…
thumbnail
spark算子
Spark的算子的分类 从大方向来说,Spark 算子大致可以分为以下两类:   &nbs…
thumbnail
impala简介
apache impala 什么是Impala? Impala是用于处理存储在Hadoop集群中的大…
thumbnail
K-近邻算法(KNN)
最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完…
thumbnail
DBscan聚类
1.基本概念       核心对象:若某…
thumbnail
Hbase 整理
Hbase简介 HBase是一个开源的非关系型分布式数据库( NoSQL),它参考了谷歌的BigTa…
thumbnail
《慢》
生在一个最好的时代,也是一个最坏的时代。 一直都知道自己骨子里并不是一个墨守成规的人,通过一番努力获…