本階段介紹Hive 是基于Hadoop 的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的sql 查詢功能,可以將sql 語句轉(zhuǎn)換為MapReduce 任務(wù)進行運行。其優(yōu)點是學(xué)習(xí)成本低,可以通過類SQL 語句快速實現(xiàn)簡單的MapReduce 統(tǒng)計,不必開發(fā)專門的MapReduce 應(yīng)用,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。