IBM SPSS Statistics 是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生Norman H. Nie、C.Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究開發(fā)成功,算算到現(xiàn)在已經(jīng)有49年的歷史了。2009年7月28日,IBM公司宣布用12億美元現(xiàn)金收購(gòu)統(tǒng)計(jì)分析軟件提供商SPSS公司,基本上每年都有新版本的升級(jí)。今年的8月8日,IBM SPSS Statistics 25版本正式發(fā)布,主要增強(qiáng)的功能如下
大數(shù)據(jù)標(biāo)志著業(yè)務(wù)分析的新時(shí)代到來(lái),各商業(yè)組織現(xiàn)在有機(jī)會(huì)就數(shù)據(jù)在容量、速度和多樣性的傳統(tǒng)處理能力不足問(wèn)題上作出更加明智的決策。IBM 具有得天獨(dú)厚的優(yōu)勢(shì), 可以提供全面的技術(shù)和服務(wù), 從大數(shù)據(jù)中吸取可操作的洞察力,通過(guò)與如IBM InfoSphere BigInsights 為代表的Hadoop技術(shù)互鏈, IBM Cognos 商業(yè)智能現(xiàn)在可以輕松訪問(wèn)非結(jié)構(gòu)化源數(shù)據(jù), 從而使業(yè)務(wù)分析人員能夠接觸到大量非結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)的關(guān)鍵洞察。
中國(guó)民生銀行借助真正的不間斷服務(wù)保持領(lǐng)先 CMBC 是中國(guó)領(lǐng)先的零售銀行之一,專注于中小型企業(yè)和高端零售客戶。作為中國(guó)第一家非國(guó)有企業(yè)所有的銀行, CMBC 管理的總資產(chǎn)為 3.2 萬(wàn)億人民幣,運(yùn)營(yíng) 33 家分支和超過(guò) 700 家銀行網(wǎng)點(diǎn)。
CDC是一款基于數(shù)據(jù)庫(kù)日志的實(shí)時(shí)數(shù)據(jù)復(fù)制產(chǎn)品,可以在跨平臺(tái)和異構(gòu)的數(shù)據(jù)庫(kù)環(huán)境中實(shí)現(xiàn)變化數(shù)據(jù)的實(shí)時(shí)復(fù)制,在國(guó)內(nèi)外的各個(gè)業(yè)務(wù)領(lǐng)域中有著廣泛的應(yīng)用。
IBM 數(shù)據(jù)挖掘分析平臺(tái)IBM SPSS Modeler在市場(chǎng)上一直占據(jù)領(lǐng)導(dǎo)者地位,其專業(yè)性及易用性一直受到廣大用戶的喜愛,該平臺(tái)也不負(fù)眾望,我們的研發(fā)團(tuán)隊(duì)一直致力于不斷的技術(shù)更新及功能的提升,最新版本IBM SPSS Modeler 18.1于2017-6-20正式發(fā)布,該版本又給我們帶來(lái)了哪些新的功能及技術(shù)要點(diǎn),我們將在本文做介紹,需要更進(jìn)一步了解的,可以隨時(shí)與我們聯(lián)系。
在使用IBM SPSS Modeler過(guò)程中,有一些小技巧可能容易被大家忽略,而它們卻是可以幫助我們更加高效、方便地實(shí)現(xiàn)我們需要的功能,今天給大家介紹參數(shù)及全局變量的使用。
本文針對(duì) IBM 最新開發(fā)的數(shù)據(jù)分析平臺(tái)進(jìn)行概要介紹并對(duì)其應(yīng)用進(jìn)行指導(dǎo)說(shuō)明。隨著信息技術(shù)應(yīng)用范圍的不斷擴(kuò)展,對(duì)數(shù)據(jù)進(jìn)行挖掘分析的需求日益增加,但是信息量的不斷增大及其應(yīng)用構(gòu)建的復(fù)雜性日益卻成為了傳統(tǒng)數(shù)據(jù)分析的一個(gè)瓶頸。IBM 構(gòu)建的數(shù)據(jù)分析平臺(tái)針對(duì)上述問(wèn)題,基于 Hadoop 技術(shù),對(duì)數(shù)據(jù)查詢語(yǔ)言,數(shù)據(jù)分析軟件,數(shù)據(jù)庫(kù),作業(yè)調(diào)度模塊進(jìn)行了有效整合,實(shí)現(xiàn)了對(duì)數(shù)據(jù)的有效、高效處理,保證了高度的擴(kuò)展性和兼容性。
文本數(shù)據(jù)在我們的生活中無(wú)處不在:在微信朋友圈、微博中發(fā)表的感想;在論壇上發(fā)表的評(píng)價(jià)商品的帖子;由應(yīng)用后臺(tái)自動(dòng)生成的機(jī)器日志等。這類數(shù)據(jù)本身包含了大量有用的信息,但由于文本表達(dá)方式可以很靈活,在不需要嚴(yán)格遵循語(yǔ)法的情況下也能準(zhǔn)確表達(dá)信息。比如下圖中表達(dá)人物年齡就有三種不同的說(shuō)法。
作為企業(yè)級(jí)大數(shù)據(jù)平臺(tái),各廠商在集成開源技術(shù)的同時(shí),也會(huì)在其基礎(chǔ)之上發(fā)展各種針對(duì)性的技術(shù),滿足企業(yè)各方面的需求。下面我們就簡(jiǎn)要給大家介紹IBM在BigInsights大數(shù)據(jù)平臺(tái)中,針對(duì)企業(yè)的備份恢復(fù)、多租戶等需求所進(jìn)行的一系列擴(kuò)展。
IBM InfoSphere CDC 是一款功能強(qiáng)大的數(shù)據(jù)實(shí)時(shí)復(fù)制軟件,不僅廣泛應(yīng)用于傳統(tǒng)ODS、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市及BI系統(tǒng)的異構(gòu)平臺(tái)集成,同時(shí)也提供對(duì)Cloud的全面支持;對(duì)于各種 Cloud 應(yīng)用場(chǎng)景,CDC 不僅能提供低影響、近實(shí)時(shí)的海量數(shù)據(jù)復(fù)制,同時(shí)還可確保數(shù)據(jù)在傳輸過(guò)程中的完整性和安全性。