无套内谢少妇毛片免费看看_人人入人人爱_又粗又大又硬毛片免费看_蜜桃AV无码国产丝袜在线观看

第八周 10-20 大數據繼續學習運用在模具展覽中

2019-10-20 17:00:46

今天 10-20 ，還是 1小時車程，最終停車過來，已經 9點了。

上午 zookeepper , 下午 spark ,

10:30 開始，之前一直在討論

HDFS 高可用是使用 ZOOKEEPER

這個還是對應的 KAFKA里面也能用 Zookeeper

下面的是盧老師講的

-------- 下午開始，復習 zookeeper 的內容，僅僅是一種服務包，并不是語言， spark 也是一個運用包。

主要是為了，等待出問題的時候，才進行重新選領導，以及重新廣播的應急辦法就是 zookeeper 。

大數據組件原理總結-Hadoop、Hbase、Kafka、Zookeeper、Spark

Hadoop原理

分為HDFS與Yarn兩個部分。HDFS有Namenode和Datanode兩個部分。

HBase原理

Hbase是列存儲數據庫。其存儲的組織結構就是將相同的列族存儲在一起，因此得名的。

Zookeeper原理

Zookeeper是一個資源管理庫，對節點進行協調、通信、失敗處理、節點損壞的處理等，是一個無中心設計，主節點通過選舉產生。

Kafka原理
Kafka是分布式發布-訂閱消息系統。

Spark原理

spark 可以很容易和yarn結合，直接調用HDFS、Hbase上面的數據，和hadoop結合。

應用場景：集群管理

Hbase Master選舉則是zookeeper經典的使用場景；

Storm集群管理

Zookeeper通過維護一個分布式目錄數據結構，實現分布式協調服務

利用Zookeeper有序目錄的創建和刪除，實現分布式共享鎖。

------------下午 4:20 開始學習 Spark 2009年誕生于apache 一站式的批處理，實時流處理

深圳塑膠模具廠,深圳市模具廠,深圳模具廠,深圳模具,深圳塑膠模具

Spark生態系統已經發展成為一個包含多個子項目的集合，其中包含SparkSQL、SparkStreaming、GraphX、MLlib等子項目，Spark是基于內存計算的大數據并行計算框架，提高了在大數據環境下數據處理的實時性，同時保證了高容錯性和高可伸縮性，允許用戶將Spark部署在大量廉價硬件之上，形成集群。

使用的語言是Scala，項目的core部分的代碼只有63個Scala文件，非常短小精悍。

Spark 是在 Scala 語言中實現的，它將 Scala 用作其應用程序框架。

與 Hadoop 不同，Spark 和 Scala 能夠緊密集成，其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數據集。

Spark 4大特性

深圳塑膠模具廠,深圳市模具廠,深圳模具廠,深圳模具,深圳塑膠模具

標簽: 第八周 10-20 大數據繼續學習運用在模具展覽中