轉帖|行業資訊|編輯:陳俊吉|2016-06-01 11:10:21.000|閱讀 353 次
概述:本期主要講解如何使用Watson Analytics獲取更優質的數據,以及介紹Watson Analytics的具體功能。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
上期文章《互聯網時代,人人均可開啟自助分析之旅》給大家簡單介紹了Watson Analytics及其相關特點。接下來幾期文章將為大家一一介紹Watson Analytics的具體功能。
我們知道,Watson Analytics能夠提供自動數據獲取、數據探索、講故事及向導式的預測分析功能,它能幫助無IT經驗的業務用戶不論何時何地,都可以從自己的數據集中找到業務問題的答案。
Watson Analytics的確是大數據分析領域的一次革命:
使用Watson Analytics進行數據分析的過程如下圖所示。
Watson Analytics嵌入式的數據管理服務包括數據訪問、數據優化和數據管理。基于云平臺的數據管理服務能夠自動搜索、獲取并優化數據集,完成所有這些工作僅僅需要您點擊按鈕即可實現。并且,它使用了最新的列式存儲、內存計算的技術來輕松應對海量的數據集。Watson Analytics也能夠對已加載數據的數據質量進行評分,突出顯示那些可能危害分析結果的潛在的數據問題。這些能力對您意味著什么呢?基本上您不再需要擔心數據質量問題了。實際上,Watson Analytics就是用來分析那些您認為已經準備好的數據。依靠自動化處理與內置的數據優化服務,您可以得到最佳狀態的數據并更好的理解它們。不論您身處市場、銷售、IT、運營、人力資源,或者財務等部門,有了高質量可信的數據,接下來的數據分析工作就將得心應手了。
示例體驗
下面我們通過一個實際的例子體會Watson Analytics的這一能力。
1. 登錄Watson Analytics(您可以通過本文最后章節的試用鏈接注冊,并得到免費試用版本)。
2. 加載數據。
單擊下圖中的“Add”圖標添加需要分析的數據。
在出現的窗口中,有三種方式添加數據。分別是通過拖拽方式、選擇上傳文件、選擇示例數據。如下圖所示。如果您使用的是個人版、專業版等其它版本的Watson Analytics,您還可以連接其它數據源獲取數據,如:關系型數據庫、Cognos報表、Twitter、DropBox、Box、OneDrive等等。
這里我們選擇第3項Sample data,我們選擇了American Time Use Survey data set。這是來自美國勞工部的關于美國勞工時間使用統計的一個數據集。單擊上傳按鈕“Upload”。如下圖所示。
接下來,Watson Analytics會選取對應的數據文件加載到云端的數據庫,并進行轉換、數據質量評分,完成后以圖標方式列在主頁面上。如下圖所示紅框中的圖標即是已經加載的數據。我們可以看到系統對這個數據集的綜合評分為62分。
3. 優化數據。
單擊上圖紅框中的數據集,將出現下圖中的浮動窗口,單擊“Refine”圖標。
您將看到剛剛加載的數據集的詳細數據質量情況。如下圖所示。
您可以單擊左側菜單欄里的“Action”圖標對數據集中的已有的數據列進行篩選;對某個數據列也可以編輯它的類型,并進行數據過濾,數據清洗,數值類型數據可以修改匯總的方法;也可以通過計算、分組、建立層級的方式創建新的數據列。如下圖所示。
您也可以單擊左側菜單欄里的“Data Metrics”圖標來查看數據集中的數據列的數據質量評分。系統將以圖形方式顯示數據列的評分及該列的數據分布情況。您可以通過點擊“Action”按鈕來調整優化數據,來提高數據質量。如下圖所示。
最后,您可以單擊頁面左上方的保存圖標保存已經修改的數據。如下圖所示。
可想而知,接下來的數據探索和預測分析結果就將更加準確了。
心動不如行動!現在就來體驗一下Watson Analytics的魅力吧:
via:華南IBM大數據支持團隊
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn