通過Cloudera公司提供的ApacheHadoop培訓和認證將您的知識提升到一個新的水平。
Cloudera大學提供的針對ApacheHBase為期3天的培訓課程可以讓培訓學員存儲和訪問海量的多結構化數(shù)據(jù),并且每秒的查詢速度提升至數(shù)十萬次。 提升你的生態(tài)系統(tǒng)專業(yè)知識 ApacheHBase是一款建立在ApacheHadoop基礎之上的分布式、可擴展NoSQL數(shù)據(jù)庫。HBase可以將數(shù)據(jù)存儲在由數(shù)十億行和數(shù)百萬列組成的海量表中,實時地向眾多用戶和應用程序提供數(shù)據(jù)服務,并且向用戶和應用程序提供快速、隨機的讀/寫存取功能。 一.培訓內容 ● 通過講師在課堂上的講解,以及實操練習,學員將熟悉Hadoop生態(tài)系統(tǒng),學習主題包括: ● HBase、Hadoop和RDBMS的使用案例和使用場合。 ● 使用HBaseShell直接操作HBase表。 ● 設計HBase架構以實現(xiàn)高效的數(shù)據(jù)存儲和恢復功能。 ● 如何實時地使用JavaAPI插入和檢索數(shù)據(jù)而實現(xiàn)與HBase的連接。 ● 適用于識別和解決性能瓶頸的實踐。 二.培訓對象及學員基礎 本課程適合打算使用HBase的開發(fā)員和管理員。擁有數(shù)據(jù)庫和數(shù)據(jù)建模的先前經(jīng)驗對于學習本課程是有幫助的,但不是必需的。本課程要求培訓學員具備Java知識。對于參加本培訓課程而言,Hadoop先驗知識不是必需的,但是Cloudera公司開發(fā)類的培訓可以作為本課程的前序課程。 三.課程大綱 1. Hadoop和HBase介紹 ● 什么是大數(shù)據(jù) ● Hadoop介紹 ● Hadoop組件 ● 什么是HBase ● 為什么使用HBase ● HBase的優(yōu)勢 ● 生產(chǎn)中的HBase ● HBase的弱點 2. HBaseTables ● HBase概念 ● HBaseTable基礎知識 ● 表設計思考 3. HBaseShell ● 通過HBaseShell創(chuàng)建表 ● 表的使用 ● 表數(shù)據(jù)的使用 4. HBase架構基礎知識 ● HBase區(qū)域 ● HBase集群架構 ● HBase和HDFS數(shù)據(jù)本地性 5. HBase模式設計 ● 一般設計考慮 ● 以應用程序為中心的設計 ● 設計HBase行鍵 ● 其它HBas表功能 6. 基于HBaseAPI的基本數(shù)據(jù)訪問 ● 訪問HBase數(shù)據(jù)的選項 ● 創(chuàng)建和刪除HBase表 ● 使用Get檢索數(shù)據(jù) ● 使用Scan檢索數(shù)據(jù) ● 插入和更新數(shù)據(jù) ● 刪除數(shù)據(jù) 7. 更多高級HBaseAPI功能 ● 篩選掃描 ● 實踐 ● HBase協(xié)同處理器 8. 集群上的HBase ● HBase如何使用HDFS ● 壓縮和分割 9. HBase的讀取和寫入 ● HBase如何寫入數(shù)據(jù) ● HBase如何讀取數(shù)據(jù) ● 讀取數(shù)據(jù)的塊緩存 10. HBase性能優(yōu)化 ● 列族注意事項 ● 模式設計注意事項 ● 高速緩存的配置 ● 時間序列和順序數(shù)據(jù)的處理 ● 預分割 11. HBase系統(tǒng)管理與集群管理 ● HBase守護進程 ● ZooKeeper注意事項 ● HBase的高可用性 ● HBaseBalancer的使用 ● 使用hbck修復表 ● HBase的安全性 12. HBase的復制和備份 ● HBase的復制 ● HBase的備份 ● MapReduce和HBase集群 13. Hive、Impala與HBase的協(xié)同使用 ● Hive、Impala與HBase的協(xié)同使用 14. 總結
Cloudera大數(shù)據(jù)課程體系