搭建企業(yè)級(jí)大數(shù)據(jù)分析平臺(tái)也可以很簡(jiǎn)單!
對(duì)于大數(shù)據(jù)分析平臺(tái)的建設(shè),往往不是某個(gè)產(chǎn)品就能夠滿足,而是需要多種不同的產(chǎn)品一起搭建。例如,搭建大數(shù)據(jù)平臺(tái)需要大規(guī)模數(shù)據(jù)存儲(chǔ)平臺(tái),需要數(shù)據(jù)處理和挖掘工具,分析結(jié)果需要通過(guò)展現(xiàn)工具體現(xiàn)大數(shù)據(jù)分析的價(jià)值。所以,沒(méi)有一個(gè)完善的生態(tài)系統(tǒng),大數(shù)據(jù)分析平臺(tái)是搭建不起來(lái)的。
IBM作為領(lǐng)域的領(lǐng)導(dǎo)者,有著其他廠商或開(kāi)源無(wú)法比擬的完整BigData生態(tài)系統(tǒng)。下面然讓我們來(lái)看看這個(gè)生態(tài)系統(tǒng)包括哪些產(chǎn)品。

IBM Open Platform with Apache Hadoop
IOP是IBM遵循Open Data Platform Initiative 聯(lián)盟標(biāo)準(zhǔn)構(gòu)建,以開(kāi)源技術(shù)為核心的產(chǎn)品包。所包含的內(nèi)容100%開(kāi)源,包括HDFS、Spark、HBase、Kafka等。用戶如果想使用IOP,完全可以免費(fèi)下載和使用,包括在生產(chǎn)環(huán)境上使用。在免費(fèi)使用的基礎(chǔ)上,IBM還提供了有償?shù)募夹g(shù)支持。

是實(shí)現(xiàn)IBM大數(shù)據(jù)戰(zhàn)略的重要旗艦產(chǎn)品,它包含了開(kāi)源部分-即IOP,和增值部分。BigInsights增值部分則包括了BigSQL-業(yè)界最先進(jìn)、最成熟的SQL on Hadoop引擎,Text Analytics-基于拖拽的文本分析工具,Big Sheet -類似電子表格的數(shù)據(jù)處理工具,BigR -適合在分布式平臺(tái)運(yùn)行的R改進(jìn)版本等高級(jí)功能。

是一個(gè)高級(jí)流計(jì)算平臺(tái),幫助用戶開(kāi)發(fā)的應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來(lái)自數(shù)千個(gè)實(shí)時(shí)源的信息。它可處理非常高的數(shù)據(jù)吞吐率,最高可達(dá)每秒數(shù)百萬(wàn)個(gè)事件或消息。Streams 旨在從一個(gè)幾分鐘到幾小時(shí)的窗口中的移動(dòng)信息(數(shù)據(jù)流)中揭示有意義的模式。該平臺(tái)能夠獲取低延遲洞察,并為注重時(shí)效的應(yīng)用程序(比如欺詐檢測(cè)或網(wǎng)絡(luò)管理)獲取更好的成果,從而提供業(yè)務(wù)價(jià)值。

我們常說(shuō)的SPSS包含 和SPSS Analytic Server。SPSS Modeler是一款數(shù)據(jù)挖掘分析的行業(yè)軟件,其采用數(shù)據(jù)流的方式來(lái)展示數(shù)據(jù)挖掘的操作過(guò)程,并結(jié)合CRISP-DM 工業(yè)標(biāo)準(zhǔn)打造了一個(gè)支持眾多數(shù)據(jù)挖掘操作的應(yīng)用平臺(tái)。SPSS Analytic Server是大數(shù)據(jù)分析的解決方案,它提供了一個(gè)易于實(shí)現(xiàn)的框架,從而能夠在分布式文件系統(tǒng)上來(lái)執(zhí)行大數(shù)據(jù)分析。它將IBM SPSS 現(xiàn)有的商業(yè)分析技術(shù)與大數(shù)據(jù)技術(shù)相結(jié)合,使得用戶能夠使用復(fù)雜的分析算法以高可伸縮的方式來(lái)解決基于大數(shù)據(jù)的分析問(wèn)題。

集成了Wandisco Fusion技術(shù),為Hadoop集群實(shí)現(xiàn)數(shù)據(jù)復(fù)制和高可用方案。BigReplicate為跨任意距離的Hadoop集群提供了單一虛擬命名空間,從而打破信息孤島,實(shí)現(xiàn)Hadoop集群之間的自由、靈活數(shù)據(jù)復(fù)制。

IBM Big Integrate
Big Integrate是的Hadoop版本,為大數(shù)據(jù)平臺(tái)提供企業(yè)級(jí)ETL方案。

IBM BigQuality
BigQuality采用Data Quality 引擎,為Hadoop環(huán)境提供數(shù)據(jù)分析、清洗和數(shù)據(jù)質(zhì)量監(jiān)控的功能。

IBM Big Match
Big Match使用的相同算法,幫助用戶解決Hadoop環(huán)境中跨非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的客戶身份匹配的挑戰(zhàn)。

結(jié)束語(yǔ)
IBM 提供了企業(yè)級(jí)Hadoop方案-,而且提供了完善的生態(tài)系統(tǒng),為用戶建設(shè)大數(shù)據(jù)平臺(tái)提供完整的產(chǎn)品支持。
詳情請(qǐng)咨詢!
客服熱線:023-66090381