你了解kafka嗎?目前它在一線互聯網公司以迅雷不及掩耳之勢得到了廣泛的應用。但究竟是什么呢?Kafka最初于2011年在LinkedIn開發,自那時起經歷了很多改進。如今它是一個完整的平臺,允許您冗余地存儲荒謬的數據量,擁有一個具有巨大吞吐量(數百萬/秒)的消息總線,并對同時通過它的數據使用實時流處理。
今天分享的這份資料,包括121頁的Kafka官方中文文檔和Kafka常見面試題,由于內容過多,在此只以截圖展示部分內容,詳細完整版的文檔領取方式請見文末。
這份文檔的價值這份Kafka官方中文文檔既適合小白入門也適合有一定基礎的同學進階提升。這份文檔共分為9大部分:Kafka基礎入門,APIS,Kafka配置,Kafka設計思想及實現,操作,安全,Kafka 連接器及Kafka streams。幾乎涵蓋了Kafka所有的知識點,一份文檔在手,輕松學會Kafka!
第一部分:Kafka基礎入門
這一部分是學習Kafka的準備階段,Kafka的發展,使用案例,下載及歷史版本,都在這一部分進行了詳細的描述。
第二部分:APIS
kafka包括五個核心APIS,在這一部分中分別對其進行了詳解。1. Producer API允許應用程序將數據流發送到Kafka集群中的主題。
2. Consumer API允許應用程序從Kafka集群中的主題讀取數據流。
3. Streams API允許將輸入主題中的數據流轉換為輸出主題。
4. Connect API允許實現將數據不斷從某些源系統或應用程序中輸入Kafka的連接器,或從Kafka輸入某些接收器系統或應用程序。
5. AdminClient API允許管理和檢查主題,代理和其他Kafka對象。
第三部分:配置
第四部分:設計思想
這一部分介紹了Kafka的設計思想以及一些重要概念解析:生產者,備份,消息分發策略,日志壓縮······
第五部分:實現思路
第五部分承接第四部分的內容,對Kafka的實現思路進行了詳盡介紹。
第六部分:Kafka操作
接下來就進入了實操階段,基本原理,基礎概念了解清楚之后正式開始上手,這一部分的內容會比較多,是基于LinkedIn使用Kafka作為生產系統的一些使用經驗。基礎配置,硬件操作系統及監控,zookeeper等內容都需要在本章掌握。
第七部分:Kafka安全
Kafka具有特性,通過單獨使用或者?起使用這些特性,提高了Kafka集群的安全性。
第八部分:Kafka連接器
這一部分主要介紹了:Kafka Connect ——?款可擴展并且可靠地在 Apache Kafka 和其他系統之間進行數據傳輸的工具。
Kafka Connect 可以攝取數據庫數據或者收集應用程序的 metrics 存儲到 Kafka topics,使得數據可以用于低延遲的流處理。一個導出的 job 可以將來自 Kafkatopic 的數據傳輸到二級存儲,用于系統查詢或者批量進行離線分析。
第九部分:Kafka Streams
Kafka Streams 是一個用于處理和分析存儲在 Kafka 系統中的數據的客戶端庫。它建立在重要的流處理概念上,如恰當地區分事件時間(event time)和處理時間(processing time),支持窗口操作(window),exactly-once 處理語義以及簡單高效的應用程序狀態管理。Kafka Streams 的入門門檻很低。我們可以在單節點環境上快速實現一個小規模的驗證性的程序,只要程序能在多節點的集群環境成功運行即可部署到高負載的生產環境。Kafka Streams 通過利用Kafka 的并行模型實現對相同應用程序的多個實例的負載平衡,這對于用戶來說是透明的。
此外,還為大家準備了一份Kafka面試題(基礎+進階+高級),共44個知識點!
如果有需要完整版的朋友可以識別下方二維碼,回復關鍵詞“Kafka”即可全部打包帶走!
注意拼寫正確!直接復制關鍵詞領取更方便
(識別后絕對100%發放)
資料來源自網絡,侵刪歉!https://kafka.apachecn.org/
本文鏈接:http://www.thecarconnectin.com/44078.html
網友評論comments