微軟SQL Server增加對Hadoop的支持 |
發(fā)布時間: 2012/7/28 13:48:28 |
在海量數(shù)據(jù)時代的大趨勢下,微軟增加了SQL Server大規(guī)模數(shù)據(jù)處理和并行數(shù)據(jù)倉庫平臺對開源Hadoop框架的支持。根據(jù)本周SQL Server團隊的官方博客消息,配合微軟數(shù)據(jù)倉庫和Hadoop連接器的社區(qū)技術預覽版也將會很快面世。 海量數(shù)據(jù)主要來源于企業(yè)中日益增長的數(shù)據(jù),特別是Web流量等。微軟在其博客上表示“我們的客戶一直要求我們幫助其存儲、管理并分析結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),特別是在Hadoop環(huán)境中存儲的數(shù)據(jù)。” 微軟表示,隨著新連接工具的出現(xiàn),客戶將能夠在Hadoop、SQL Server和并行數(shù)據(jù)倉換環(huán)境下相互交換數(shù)據(jù)。 Hadoop是一個分布式系統(tǒng)基礎架構(gòu),由Apache基金會開發(fā)。是原Yahoo員工Doug Cutting根據(jù)Google發(fā)布的學術論文研究而來,并以Google開發(fā)的MapReduce編程模型為基礎。 圍繞Hadoop的越來越多的商業(yè)生態(tài)系統(tǒng)漸漸出現(xiàn),例如Cloudera公司就提供相關服務和專業(yè)的分布式框架。Forrester研究分析員James Kobielus表示鑒于數(shù)據(jù)倉庫商(如EMC和Teradata)已經(jīng)可以開始采用Hadoop,所以說微軟此舉是明智的。他補充說“越來越多的企業(yè)正在運行Hadoop集群,他們希望能夠?qū)⑦@些系統(tǒng)中的數(shù)據(jù)發(fā)送到數(shù)據(jù)倉庫系統(tǒng)”。 但現(xiàn)在還沒有哪家廠商可以提供整套Hadoop服務。其中包括分布式、Hadoop相關項目的連接器(例如Cassandra數(shù)據(jù)庫)模塊化工具和其他組件等。 點擊查看大圖 毫無疑問,微軟像其他的廠商一樣,已經(jīng)正式提出Hadoop的計劃,但還沒有將發(fā)展的路線圖公布于眾。同時微軟支持Hadoop并沒有影響他們自己的研究項目。上個月微軟發(fā)布了Daytona項目,微軟描述該項目是一個“運行在Windows Azure上的MapReduce”。主要是為了支持數(shù)據(jù)分析和人工智能算法?芍С謹U展幾百服務器內(nèi)核并分析分布式數(shù)據(jù)。 最近,微軟宣布他們已經(jīng)發(fā)布了并行數(shù)據(jù)倉庫設備的第二次更新,此次功能的更新兼顧軟件組件和硬件組件。包括新的第三方BI(商業(yè)智能)連接器和SAP、Informatica以及Microstrategy提供的數(shù)據(jù)集成工具。此外,微軟表示基于戴爾硬件的并行數(shù)據(jù)倉庫的版本已經(jīng)有售,每TB的最低價格為1.2萬美元。 本文出自:億恩科技【1tcdy.com】 |