亚洲综合社区欧美综合色-欧美逼逼一区二区三区-国产老熟女高潮精品网站-国产日韩最新视频在线看

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

分布式計算Hadoop簡介

發(fā)布時間:  2012/9/20 21:01:54

Hadoop是什么:Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺,是Appach的一個用java語言實現(xiàn)開源軟件框架,實現(xiàn)在大量計算機組成的集群中對海量數(shù)據(jù)進行分布式計算。

Hadoop框架中最核心設計就是:HDFS和MapReduce。HDFS提供了海量數(shù)據(jù)的存儲,MapReduce提供了對數(shù)據(jù)的計算。

數(shù)據(jù)在Hadoop中處理的流程可以簡單的按照下圖來理解:數(shù)據(jù)通過Haddop的集群處理后得到結(jié)果。

 

HDFS:Hadoop Distributed File System,Hadoop的分布式文件系統(tǒng)。

大文件被分成默認64M一塊的數(shù)據(jù)塊分布存儲在集群機器中。

如下圖中的文件 data1被分成3塊,這3塊以冗余鏡像的方式分布在不同的機器中。

 

MapReduce:Hadoop為每一個input split創(chuàng)建一個task調(diào)用Map計算,在此task中依次處理此split中的一個個記錄(record),map會將結(jié)果以key--value的形式輸出,hadoop負責按key值將map的輸出整理后作為Reduce的輸入,Reduce Task的輸出為整個job的輸出,保存在HDFS上。


本文出自:億恩科技【1tcdy.com】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線