原創(chuàng)|行業(yè)資訊|編輯:況魚杰|2020-11-20 10:17:39.020|閱讀 308 次
概述:任何曾經(jīng)從事數(shù)據(jù)倉庫項(xiàng)目工作的人都知道,這可能是一項(xiàng)艱巨的工作,需要數(shù)年的時(shí)間才能完成,并花費(fèi)數(shù)百萬美元。所以總是有人希望能夠解決數(shù)據(jù)倉庫的問題,Qlik就應(yīng)運(yùn)而生,它最大功能之一就是無需數(shù)據(jù)倉庫即可將多個(gè)不同的數(shù)據(jù)源整合在一起。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
任何曾經(jīng)從事數(shù)據(jù)倉庫項(xiàng)目工作的人都知道,這可能是一項(xiàng)艱巨的工作,需要數(shù)年的時(shí)間才能完成,并花費(fèi)數(shù)百萬美元。所以總是有人希望能夠解決數(shù)據(jù)倉庫的問題,Qlik就應(yīng)運(yùn)而生,它最大功能之一就是無需數(shù)據(jù)倉庫即可將多個(gè)不同的數(shù)據(jù)源整合在一起。即使使用數(shù)據(jù)倉庫,客戶也經(jīng)常直接從數(shù)據(jù)源中拉取,以避免由于將數(shù)據(jù)通過數(shù)據(jù)倉庫而造成的時(shí)間滯后。
那么,在沒有數(shù)據(jù)倉庫的情況下構(gòu)建健壯的BI應(yīng)用程序容易嗎?
通常情況下,用戶從1到5個(gè)不同的源頭提取數(shù)據(jù)來構(gòu)建一個(gè)單一的應(yīng)用程序。數(shù)據(jù)可以來自ERP系統(tǒng)、云服務(wù)或其他手工文件。將這些數(shù)據(jù)文件匯集到一個(gè)單一的數(shù)據(jù)模型的過程被稱為ETL或提取-轉(zhuǎn)換-加載。雖然在提取和加載中可能會遇到挑戰(zhàn),但最困難的任務(wù)是Transform--在無人看管的情況下運(yùn)行的腳本,將數(shù)據(jù) "轉(zhuǎn)化 "為標(biāo)準(zhǔn)格式和/或填充缺失或損壞的數(shù)據(jù),使其成為最終用戶可用的數(shù)據(jù)。
在光譜的另一端,Qlik與客戶合作,他們的數(shù)據(jù)源數(shù)量是典型數(shù)據(jù)源數(shù)量的10倍以上,所有的數(shù)據(jù)源看起來都是來自單一的數(shù)據(jù)源,以便在單一的應(yīng)用程序中利用。如何您很想知道如何處理如此復(fù)雜的項(xiàng)目的第一手資料,那么你不得不看看下面的內(nèi)容,Peter Adams-Qlik的顧問,曾參與過超過35個(gè)不同規(guī)模的客戶項(xiàng)目,下面是他介紹的有關(guān)Qlik的信息。
Peter介紹了他最極端的數(shù)據(jù)整合項(xiàng)目,該客戶通過收購迅速成長,現(xiàn)在需要一個(gè)企業(yè)業(yè)務(wù)視圖。他的任務(wù)是整合50多個(gè)數(shù)據(jù)源,每個(gè)數(shù)據(jù)源都有多個(gè)文件,導(dǎo)致超過300個(gè)數(shù)據(jù)文件需要被ETL成一個(gè)數(shù)據(jù)模型。
Peter分享說,對于任何規(guī)模的數(shù)據(jù)集成項(xiàng)目,最大的挑戰(zhàn)總是數(shù)據(jù)不一致。在這個(gè)特殊的案例中,這個(gè)問題的難度成倍增加,因?yàn)閿?shù)據(jù)文件的創(chuàng)建和交付不是自動(dòng)化的,這就為數(shù)據(jù)的變化創(chuàng)造了機(jī)會,而沒有警告。因此,除了建立一個(gè)ETL來支持不同的數(shù)據(jù)之外,他還必須適應(yīng)當(dāng)數(shù)據(jù)已經(jīng)變化到無法再成功轉(zhuǎn)換,因此在解決之前不再有用的時(shí)候,警告最終用戶。
Peter在這個(gè)項(xiàng)目中面臨的另一個(gè)獨(dú)特的挑戰(zhàn)是復(fù)制ERP的 "匹配 "功能作為轉(zhuǎn)型的一部分--將收據(jù)與訂單數(shù)量進(jìn)行匹配,以計(jì)算剩余的未結(jié)訂單金額,按項(xiàng)目進(jìn)行。為此,他必須通過多個(gè)腳本來運(yùn)行數(shù)據(jù),以分解單個(gè)收據(jù)記錄,以對應(yīng)訂單表中的數(shù)量。
在ETL中,Peter總共構(gòu)建了大約100個(gè)腳本。但在處理生產(chǎn)級的大量數(shù)據(jù)時(shí),這對性能有什么影響呢?在設(shè)計(jì)和構(gòu)建ETL時(shí),性能是最重要的。但Peter的做法是始終在性能和易維護(hù)性之間取得平衡,尤其是在這種情況下,數(shù)據(jù)源有可能發(fā)生意外變化。一旦Peter在ETL運(yùn)行時(shí)間最長的部分部署了增量加載,加載時(shí)間就在客戶所需的參數(shù)范圍內(nèi),同時(shí)還能確保他們在沒有我們幫助的情況下也能繼續(xù)適應(yīng)變化。
最后您會發(fā)現(xiàn),盡管您花了更多時(shí)間來考慮“典型”的項(xiàng)目,但與建立數(shù)據(jù)倉庫相比,客戶節(jié)省了75%至90%的時(shí)間和金錢。Qlik Consulting的經(jīng)驗(yàn)和技能幫助成功設(shè)計(jì)和構(gòu)建了一個(gè)非常復(fù)雜的ETL,不僅節(jié)省了客戶資金,而且還使他們能夠更早地洞察其數(shù)據(jù),從而可以提高投資回報(bào)率!
Qlik的愿景是一個(gè)數(shù)據(jù)素養(yǎng)的世界,每個(gè)人都可以使用數(shù)據(jù)來改善決策并解決他們最具挑戰(zhàn)性的問題。只有Qlik提供端到端的實(shí)時(shí)數(shù)據(jù)集成和分析解決方案,以幫助組織訪問所有數(shù)據(jù)并將其轉(zhuǎn)化為價(jià)值。慧都作為Qlik官方的中國合作伙伴,我們?yōu)镼lik的中國用戶提供產(chǎn)品授權(quán)與實(shí)施、定制分析方案、技術(shù)培訓(xùn)等服務(wù),旨在讓中國企業(yè)的每個(gè)Qlik用戶都能探索出數(shù)據(jù)的價(jià)值,讓企業(yè)形成分析文化。了解更多信息,請咨詢在線客服>>
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn