无套内谢少妇毛片免费看看_人人入人人爱_又粗又大又硬毛片免费看_蜜桃AV无码国产丝袜在线观看

第八周 10-20 大數據繼續學習 運用在 模具展覽中

2019-10-20 17:00:46

今天 10-20 ,還是  1小時 車程, 最終停車過來, 已經 9點 了 。


上午  zookeepper   ,  下午 spark ,     


10:30 開始, 之前一直在討論 



image.png


image.png

HDFS  高可用 是使用  ZOOKEEPER  

image.png


這個還是對應的  KAFKA里面也能用 Zookeeper


image.png




image.png


image.png


image.png




image.png


image.png



image.png


下面的是盧老師講的

image.png


image.png

image.png

image.png


image.png

image.png


image.png


image.pngimage.png

image.png


image.png

image.png


image.png


image.png


image.png


image.png

image.png


image.png

-------- 下午開始  ,復習 zookeeper 的內容, 僅僅是一種服務包, 并不是語言, spark 也是一個運用包。


主要是為了, 等待出問題的時候, 才進行重新選領導,以及重新廣播的應急辦法就是  zookeeper 。


image.png


大數據組件原理總結-Hadoop、Hbase、Kafka、Zookeeper、Spark


Hadoop原理

  分為HDFSYarn兩個部分。HDFSNamenodeDatanode兩個部分。


HBase原理

Hbase是列存儲數據庫。其存儲的組織結構就是將相同的列族存儲在一起,因此得名的。


Zookeeper原理

Zookeeper是一個資源管理庫,對節點進行協調、通信、失敗處理、節點損壞的處理等,是一個無中心設計,主節點通過選舉產生。


Kafka原理
Kafka是分布式發布-訂閱消息系統。


Spark原理

spark 可以很容易和yarn結合,直接調用HDFSHbase上面的數據,和hadoop結合。



image.png


image.png

image.pngimage.png

image.png

image.png

image.png


應用場景:集群管理

Hbase Master選舉則是zookeeper經典的使用場景;

Storm集群管理

image.png


image.png


Zookeeper通過維護一個分布式目錄數據結構,實現分布式協調服務

利用Zookeeper有序目錄的創建和刪除,實現分布式共享鎖。


image.png


image.png



image.png



image.png




image.png

------------下午  4:20 開始學習  Spark     2009年誕生于apache   一站式的批處理,實時流處理



深圳塑膠模具廠,深圳市模具廠,深圳模具廠,深圳模具,深圳塑膠模具


image.png

Spark生態系統已經發展成為一個包含多個子項目的集合,其中包含SparkSQL、SparkStreaming、GraphX、MLlib等子項目,Spark是基于內存計算的大數據并行計算框架,提高了在大數據環境下數據處理的實時性,同時保證了高容錯性和高可伸縮性,允許用戶將Spark部署在大量廉價硬件之上,形成集群。


使用的語言是Scala,項目的core部分的代碼只有63個Scala文件,非常短小精悍。


Spark 是在 Scala 語言中實現的,它將 Scala 用作其應用程序框架。

與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數據集。



Spark 4大特性

image.png



image.png


image.png


image.png

image.png


image.png


深圳塑膠模具廠,深圳市模具廠,深圳模具廠,深圳模具,深圳塑膠模具

image.png


image.png


image.png