搜索资源列表
databricks-spark-reference-applications.pdf.tar
- 摘要: 现有的聚类算法比如 CluStream 是基于 k-means 算法的。这些算法不能够发现任 意形状的簇以及不能处理离群点。 解决上述问题,本文提出了 而且, 它需要预先知道 k 值和用户指定的时间窗口。 为了 分将数据映射到一个网格, D-Stream 算法,它是基于密度的算法。这个算法用一个在线部 在离线部分计算网格的密度然后基于密度形成簇。 度衰减技术来捕获数据流的动态变化。 为了探索衰减因子、 数据
Spark学习总结-入门
- 这是一位大数据分析开发者的一本Spark入门学习用的总结(Spark Learning Summary - Getting Started)
spark初级.tar
- Spark入门教程,学习使用简短代码进行复杂并行作业,流处理,机器学习作业(Introductory tutorials of Spark)
Red Hat Enterprise Linux 7 高薪运维入门
- Red Hat Enterprise Linux 7发布已经超过1年时间了,不同于以往的版本,红帽公司在新版本上进行了大刀阔斧的改革,包括系统架构、防火墙管理工具等核心部件都已经发生了改变。《Red Hat Enterprise Linux 7 高薪运维入门》就是立足于Red Hat Enterprise Linux 7版本,带领读者学会最基本的Linux系统管理和网络管理。 本书分为3部分:第1部分是Linux入门,包括必须掌握