原創(chuàng)|大數(shù)據(jù)新聞|編輯:鄭恭琳|2020-09-04 09:41:14.200|閱讀 338 次
概述:批量同步工具主要用于在大數(shù)據(jù)集群、數(shù)據(jù)倉庫與傳統(tǒng)的數(shù)據(jù)庫(mysql、postgresql...)間進行數(shù)據(jù)的傳遞,可以將一個關(guān)系型數(shù)據(jù)庫(例如 :mySQL,Oracle等)中的數(shù)據(jù)導進到大數(shù)據(jù)存儲系統(tǒng)中,也可以將集群上的數(shù)據(jù)導進到關(guān)系型數(shù)據(jù)庫中。實時數(shù)據(jù)采集工具是一個從可以收集例如日志,事件等數(shù)據(jù)資源,并將這些數(shù)量龐大的數(shù)據(jù)從各項數(shù)據(jù)資源中集中起來存儲的工具/服務(wù)。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
GetInsight是慧都自主研發(fā)、應(yīng)用最靈活的大數(shù)據(jù)平臺。能夠幫助您隨時找到您想要的數(shù)據(jù),使數(shù)據(jù)得到安全、穩(wěn)定和高效的管理與應(yīng)用。GetInsight是企業(yè)大數(shù)據(jù)解決方案的重要組成部分,除了提供完整的大數(shù)據(jù)功能組件,我們還提供組件自定義搭配,為企業(yè)選擇滿足方案需要的大數(shù)據(jù)功能組件,使您的大數(shù)據(jù)解決方案成本降到最低,從而高品質(zhì)的解決您的大數(shù)據(jù)需求問題。
了解什么是GetInsight,請點擊這里查看GetInsight的基礎(chǔ)介紹>>
本文主要跟大家介紹GetInsight的數(shù)據(jù)批量同步工具和數(shù)據(jù)實時同步工具。
批量同步工具主要用于在大數(shù)據(jù)集群、數(shù)據(jù)倉庫與傳統(tǒng)的數(shù)據(jù)庫(mysql、postgresql...)間進行數(shù)據(jù)的傳遞,可以將一個關(guān)系型數(shù)據(jù)庫(例如 :mySQL,Oracle等)中的數(shù)據(jù)導進到大數(shù)據(jù)存儲系統(tǒng)中,也可以將集群上的數(shù)據(jù)導進到關(guān)系型數(shù)據(jù)庫中。它可以高效、可控地利用資源,可以通過調(diào)整任務(wù)數(shù)來控制任務(wù)的并發(fā)度。另外它還可以配置數(shù)據(jù)庫的訪問時間等等。它可以自動的完成數(shù)據(jù)類型映射與轉(zhuǎn)換。我們往往導入的數(shù)據(jù)是有類型的,它可以自動根據(jù)元數(shù)據(jù)模型來判斷數(shù)據(jù)類型,把數(shù)據(jù)庫中的類型轉(zhuǎn)換到集群上或者數(shù)據(jù)倉庫中對應(yīng)類型,當然用戶也可以自定義它們之間的映射關(guān)系。它支持多種數(shù)據(jù)庫,比如,Mysql、Oracle和PostgreSQL等等數(shù)據(jù)庫。對于某些NoSQL數(shù)據(jù)庫它也提供了連接器。
GetInsight數(shù)據(jù)批量同步工具的特性
批量同步工具具有如下特性:
GetInsight數(shù)據(jù)批量同步工具的功能
GetInsight數(shù)據(jù)批量同步工具的應(yīng)用場景
在遇到需要進行大規(guī)模的復雜的數(shù)據(jù)分析或者其他情況需要把關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)拷貝或者移植到大數(shù)據(jù)的分布式平臺上的時候,批量同步工具就非常適合實現(xiàn)大規(guī)模的從結(jié)構(gòu)化數(shù)據(jù)庫中數(shù)據(jù)批量導入到分布式文件系統(tǒng)或分布式數(shù)據(jù)庫或者數(shù)據(jù)倉庫中。做大規(guī)模數(shù)據(jù)分析以及數(shù)據(jù)處理等的前期數(shù)據(jù)轉(zhuǎn)移,把單機上的數(shù)據(jù)批量快速的轉(zhuǎn)移到分布式集群上。可以滿足增量的同步導入,還可以創(chuàng)建一些執(zhí)行計劃,通過linux的定時調(diào)度機制定期的執(zhí)行一些特定的導入操作,也可以使用任務(wù)調(diào)度工具進行批量同步任務(wù)的創(chuàng)建和統(tǒng)一管理。
也可以滿足從大數(shù)據(jù)集群上把數(shù)據(jù)導出到結(jié)構(gòu)化數(shù)據(jù)庫中,比如一些集群上的數(shù)據(jù)處理結(jié)果,數(shù)據(jù)倉庫的一些特定的表等,多數(shù)是在對分布式平臺上或者數(shù)據(jù)倉庫里面的數(shù)據(jù)分析之后產(chǎn)生的結(jié)果數(shù)據(jù)。需要導出到關(guān)系數(shù)據(jù)庫中,然后提供前端展示。
所以,批量同步工具就是為了實現(xiàn)關(guān)系數(shù)據(jù)庫(包括mysql,oracle等)與大數(shù)據(jù)平臺(包括分布式存儲系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)以及數(shù)據(jù)倉庫系統(tǒng)等)之間的相互數(shù)據(jù)傳遞。
實時數(shù)據(jù)采集工具是一個從可以收集例如日志,事件等數(shù)據(jù)資源,并將這些數(shù)量龐大的數(shù)據(jù)從各項數(shù)據(jù)資源中集中起來存儲的工具/服務(wù)。實時數(shù)據(jù)采集工具具有高可用,分布式,配置化的能力,其設(shè)計的原理也是基于將數(shù)據(jù)流,如日志數(shù)據(jù)從各種網(wǎng)站服務(wù)器上匯集起來存儲到大數(shù)據(jù)平臺(包括分布式存儲系統(tǒng)、分布式數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)倉庫系統(tǒng)等)。它能夠?qū)⒉煌瑪?shù)據(jù)源的海量日志數(shù)據(jù)進行高效收集、聚合、移動、最后存儲到一個中心化數(shù)據(jù)存儲系統(tǒng)中。實時數(shù)據(jù)采集工具是一個輕量級的小工具,適應(yīng)各種方式的日志收集,并支持故障切換和負載均衡。
實時數(shù)據(jù)采集工具的數(shù)據(jù)流由事件(Event)貫穿始終。事件是Flume的基本數(shù)據(jù)單位,它攜帶日志數(shù)據(jù)(字節(jié)數(shù)組形式)并且攜帶有頭信息,這些Event由Agent外部的Source生成,當Source捕獲事件后會進行特定的格式化,然后Source會把事件推入(單個或多個)Channel中。你可以把Channel看作是一個緩沖區(qū),它將保存事件直到Sink處理完該事件。Sink負責持久化日志或者把事件推向另一個Source。
GetInsight數(shù)據(jù)實時同步工具的特性
實時數(shù)據(jù)采集工具具有以下特性:
GetInsight數(shù)據(jù)實時同步工具的功能
GetInsight數(shù)據(jù)實時同步工具的應(yīng)用場景
關(guān)于慧都大數(shù)據(jù)分析平臺
慧都大數(shù)據(jù)分析平臺「GetInsight®」升級發(fā)布,將基于企業(yè)管理駕駛艙、產(chǎn)品質(zhì)量分析及預測、設(shè)備分析及預測等大數(shù)據(jù)模型的構(gòu)建,助力企業(yè)由傳統(tǒng)運營模式向數(shù)字化、智能化的新模式轉(zhuǎn)型升級,抓住數(shù)據(jù)經(jīng)濟的發(fā)展勢頭,提供管理效能,精準布局未來。了解更多,請聯(lián)系。
慧都大數(shù)據(jù)專業(yè)團隊為企業(yè)提供商業(yè)智能大數(shù)據(jù)平臺搭建,免費業(yè)務(wù)咨詢,定制開發(fā)等完整服務(wù),快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
歡迎撥打慧都熱線023-68661681或咨詢慧都在線客服,我們有專業(yè)的大數(shù)據(jù)團隊,為您提供免費大數(shù)據(jù)相關(guān)業(yè)務(wù)咨詢!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn