亚洲天天综合,日韩欧美自拍,欧美一区二区三区不卡

干貨丨23個適合Java開發(fā)者的大數(shù)據(jù)工具和框架

原創(chuàng)|行業(yè)資訊|編輯：陳俊吉|2017-05-04 10:04:31.000|閱讀 223 次

概述：目前，編程人員面對的最大挑戰(zhàn)就是復雜性，硬件越來越復雜，OS越來越復雜，編程語言和API越來越復雜，我們構建的應用也越來越復雜。根據(jù)外媒的一項調查報告，以下列出了Java程序員在過去12個月內一直使用的一些工具或框架，或許會對你有意義。

# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>

相關鏈接：

目前，編程人員面對的最大挑戰(zhàn)就是復雜性，硬件越來越復雜，OS越來越復雜，編程語言和API越來越復雜，我們構建的應用也越來越復雜。根據(jù)外媒的一項調查報告，以下列出了在過去12個月內一直使用的一些工具或框架，或許會對你有意義。

1、MongoDB--最受歡迎的，跨平臺的，面向文檔的數(shù)據(jù)庫。

MongoDB是一個基于分布式文件存儲的數(shù)據(jù)庫，使用C++語言編寫。旨在為Web應用提供可擴展的高性能數(shù)據(jù)存儲解決方案。應用性能高低依賴于數(shù)據(jù)庫性能，MongoDB則是非關系數(shù)據(jù)庫中功能最豐富，最像關系數(shù)據(jù)庫的，隨著MongDB 3.4版本發(fā)布，其應用場景適用能力得到了進一步拓展。

MongoDB的核心優(yōu)勢就是靈活的文檔模型、高可用復制集、可擴展分片集群。

2、Elasticsearch --為云構建的分布式RESTful搜索引擎。

ElasticSearch是基于Lucene的搜索服務器。它提供了分布式多用戶能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java開發(fā)的，并作為Apache許可條款下的開放源碼發(fā)布，是比較流行的企業(yè)級搜索引擎。

3、Cassandra--開源分布式數(shù)據(jù)庫管理系統(tǒng)，最初是由Facebook開發(fā)的，旨在處理許多商品服務器上的大量數(shù)據(jù)，提供高可用性，沒有單點故障。

Apache Cassandra是一套開源分布式NoSQL數(shù)據(jù)庫系統(tǒng)。集Google BigTable的數(shù)據(jù)模型與Amazon Dynamo的完全分布式架構于一身。于2008開源，此后，由于Cassandra良好的可擴展性，被Digg、Twitter等Web 2.0網(wǎng)站所采納，成為了一種流行的分布式結構化數(shù)據(jù)存儲方案。

4、Redis --開源(BSD許可)內存數(shù)據(jù)結構存儲，用作數(shù)據(jù)庫，緩存和消息代理。

Redis是一個開源的使用ANSI C語言編寫的、支持網(wǎng)絡、可基于內存亦可持久化的日志型、Key-Value數(shù)據(jù)庫，并提供多種語言的API。

5、Hazelcast --基于Java的開源內存數(shù)據(jù)網(wǎng)格。

Hazelcast 是一種內存數(shù)據(jù)網(wǎng)格 in-memory data grid，提供Java程序員關鍵任務交易和萬億級內存應用。雖然Hazelcast沒有所謂的‘Master’，但是仍然有一個Leader節(jié)點(the oldest member)，這個概念與ZooKeeper中的Leader類似，但是實現(xiàn)原理卻完全不同。同時，Hazelcast中的數(shù)據(jù)是分布式的，每一個member持有部分數(shù)據(jù)和相應的backup數(shù)據(jù)，這點也與ZooKeeper不同。

6、EHCache--廣泛使用的開源Java分布式緩存。主要面向通用緩存、Java EE和輕量級容器。

EhCache 是一個純Java的進程內緩存框架，具有快速、精干等特點，是Hibernate中默認的CacheProvider。主要特性有：快速簡單，具有多種緩存策略;緩存數(shù)據(jù)有兩級，內存和磁盤，因此無需擔心容量問題;緩存數(shù)據(jù)會在虛擬機重啟的過程中寫入磁盤;可以通過RMI、可插入API等方式進行分布式緩存;具有緩存和緩存管理器的偵聽接口;支持多緩存管理器實例，以及一個實例的多個緩存區(qū)域;提供Hibernate的緩存實現(xiàn)。

7、Hadoop --用Java編寫的開源軟件框架，用于分布式存儲，并對非常大的數(shù)據(jù)集進行分布式處理。

用戶可以在不了解分布式底層細節(jié)的情況下，開發(fā)分布式程序。充分利用集群進行高速運算和存儲。Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System)，簡稱HDFS。Hadoop的框架最核心的設計就是：HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲，MapReduce則為海量的數(shù)據(jù)提供了計算。

8、Solr --開源企業(yè)搜索平臺，用Java編寫，來自Apache Lucene項目。

Solr是一個獨立的企業(yè)級搜索應用服務器，它對外提供類似于Web-service的API接口。用戶可以通過http請求，向搜索引擎服務器提交一定格式的XML文件，生成索引;也可以通過Http Get操作提出查找請求，并得到XML格式的返回結果。

9、Spark --Apache Software Foundation中最活躍的項目，是一個開源集群計算框架。

Spark 是一種與 Hadoop 相似的開源集群計算環(huán)境，但是兩者之間還存在一些不同之處，這些不同之處使 Spark 在某些工作負載方面表現(xiàn)得更加優(yōu)越，換句話說，Spark 啟用了內存分布數(shù)據(jù)集，除了能夠提供交互式查詢外，它還可以優(yōu)化迭代工作負載。

Spark 是在 Scala 語言中實現(xiàn)的，它將 Scala 用作其應用程序框架。與 Hadoop 不同，Spark 和 Scala 能夠緊密集成，其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數(shù)據(jù)集。

10、Memcached --通用分布式內存緩存系統(tǒng)。

Memcached是一套分布式快取系統(tǒng)，當初是Danga Interactive為了LiveJournal所發(fā)展的，但被許多軟件(如MediaWiki)所使用。Memcached作為高速運行的分布式緩存服務器，具有以下的特點：協(xié)議簡單，基于libevent的事件處理，內置內存存儲方式。

11、Apache Hive --在Hadoop之上提供類似SQL的層。

Hive是一個基于Hadoop的數(shù)據(jù)倉庫平臺。通過hive，可以方便地進行ETL工作。hive定義了一個類似于SQL的查詢語言，能夠將用戶編寫的SQL轉化為相應的Mapreduce程序基于Hadoop執(zhí)行。目前，已經(jīng)發(fā)布了Apache Hive 2.1.1 版本。

12、Apache Kafka --最初是由LinkedIn開發(fā)的高吞吐量，分布式訂閱消息系統(tǒng)。

Apache Kafka是一個開源消息系統(tǒng)項目，由Scala寫成。該項目的目標是為處理實時數(shù)據(jù)提供一個統(tǒng)一、高通量、低等待的平臺。Kafka維護按類區(qū)分的消息，稱為主題(topic)。生產者(producer)向kafka的主題發(fā)布消息，消費者(consumer)向主題注冊，并且接收發(fā)布到這些主題的消息。

13、Akka --用于在JVM上構建高并發(fā)，分布式和彈性消息驅動應用程序的工具包。

Akka 是一個用 Scala 編寫的庫，用于簡化編寫容錯的、高可伸縮性的 Java 和 Scala 的 Actor 模型應用。它已經(jīng)成功運用在電信行業(yè)，系統(tǒng)幾乎不會宕機。

14、HBase --開放源代碼，非關系型，分布式數(shù)據(jù)庫，采用Google的BigTable建模，用Java編寫，并在HDFS上運行。

與FUJITSU Cliq等商用大數(shù)據(jù)產品不同，HBase是Google Bigtable的開源實現(xiàn)，類似Google Bigtable利用GFS作為其文件存儲系統(tǒng)，HBase利用Hadoop HDFS作為其文件存儲系統(tǒng);Google運行MapReduce來處理Bigtable中的海量數(shù)據(jù)，HBase同樣利用Hadoop MapReduce來處理HBase中的海量數(shù)據(jù);Google Bigtable利用 Chubby作為協(xié)同服務，HBase利用Zookeeper作為對應。

15、Neo4j --在Java中實現(xiàn)的開源圖形數(shù)據(jù)庫。

Neo4j是一個高性能的NOSQL圖形數(shù)據(jù)庫，它將結構化數(shù)據(jù)存儲在網(wǎng)絡上而不是表中。它是一個嵌入式的、基于磁盤的、具備完全事務特性的Java持久化引擎。

16、CouchBase --開源分布式的NoSQL面向文檔數(shù)據(jù)庫，針對交互式應用程序進行了優(yōu)化。

如果以前沒有NoSQL的使用經(jīng)驗，那么理解couchbase的時候關鍵有兩點：延后寫入和松散存儲。該產品基于Apache CouchDB，并整合了GeoCouch(一個基于Erlang、緊密集成的地理空間索引系統(tǒng)，可支持LBS應用)。

17、Apache Storm--開源分布式實時計算系統(tǒng)。

Apache Storm 是一個能近實時地在數(shù)據(jù)之上運行用戶代碼片段的流式數(shù)據(jù)處理框架。它實際上是一系列連在一起的管道。通常用于簡單的分析任務，諸如計算，以及清洗，使其常規(guī)化，并且準備攝入用于長期存儲的數(shù)據(jù)。

18、CouchDB--開源的面向文檔的NoSQL數(shù)據(jù)庫，使用JSON存儲數(shù)據(jù)。

CouchDB 是一個開源的面向文檔的數(shù)據(jù)庫管理系統(tǒng)，可以通過 RESTful JavaScript Object Notation (JSON) API 訪問。CouchDB落實到最底層的數(shù)據(jù)結構就是兩類B+Tree 。

19、Oracle Coherence--內存數(shù)據(jù)網(wǎng)格解決方案，通過提供對常用數(shù)據(jù)的快速訪問，使企業(yè)能夠可預測地擴展關鍵任務應用程序。

簡單來說，Coherence僅支持Java，.NET和C++ API三個版本，這三個都是面向對象的語言，這也說明Coherence和應用開發(fā)的親和性。

20、Titan--可擴展的圖形數(shù)據(jù)庫，優(yōu)化用于存儲和查詢包含分布在多機集群上的數(shù)百億個頂點和邊的圖形。

21、Amazon DynamoDB--快速，靈活的全面管理NoSQL的數(shù)據(jù)庫服務，適用于任何規(guī)模的要求一致性，單位毫秒延遲的應用程序。

Amazon DynamoDB 是一種完全托管的 NoSQL 數(shù)據(jù)庫服務，提供快速而可預測的性能，能夠實現(xiàn)無縫擴展。

22、Amazon Kinesis--AWS上的實時流式傳輸數(shù)據(jù)平臺。

Web 應用程序、移動設備、可穿戴設備、行業(yè)傳感器和許多軟件應用程序和服務都可能生成大量的流數(shù)據(jù)(有時達到每小時數(shù) TB)，需要對其進行連續(xù)地收集、存儲和處理。Amazon Kinesis 就是針對這種需求產生的。

23、Datomic--完全事務，云就緒，分布式數(shù)據(jù)庫，用Clojure編寫。

Datomic 是一個靈活的、基于時間因子的數(shù)據(jù)庫，支持聯(lián)合查詢，具有彈性的可擴展性以及支持ACID事務性。Datomic 提供高可用的、分布式存儲服務。

編輯推薦：

標簽：大數(shù)據(jù)Java

本站文章除注明轉載外，均為本站原創(chuàng)或翻譯。歡迎任何形式的轉載，但請務必注明出處、不得修改原文相關鏈接，如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn

上一篇：動圖演示：Excel 50個逆天功能，逼格秒升下一篇：干貨分享！DevExpress v16.2新版演示示例等你來收！（上）

相關產品

軟件

產品功能：報表

源碼：非開源

產品編號：12631

當前版本：v10 [銷售以商家最新版為準，如需其他版本，請來電咨詢]

開發(fā) 商： IBM

正式授權

">Cognos Analytics

工業(yè)4.0優(yōu)選產品 | 商業(yè)智能和績效管理軟件領導者，幫助企業(yè)成為業(yè)績最佳的分析驅動型企業(yè)

軟件

產品功能：大數(shù)據(jù)分析工具

源碼：非開源

產品編號：13729

當前版本：v18.1.1 [銷售以商家最新版為準，如需其他版本，請來電咨詢]

開發(fā) 商： IBM

正式授權

">SPSS Modeler

工業(yè)4.0優(yōu)選產品 | 在歷史數(shù)據(jù)中發(fā)現(xiàn)規(guī)律以預測未來事件，做出更好的決策，實現(xiàn)更好的成效

軟件

產品功能：大數(shù)據(jù)分析工具

源碼：非開源

產品編號：13733

當前版本： [銷售以商家最新版為準，如需其他版本，請來電咨詢]

開發(fā) 商： IBM

正式授權

">IBM BigInsights for Apache Hadoop

經(jīng)濟高效地存儲、管理和分析大數(shù)據(jù)

軟件

產品功能：大數(shù)據(jù)分析工具

源碼：非開源

產品編號：13735

當前版本： [銷售以商家最新版為準，如需其他版本，請來電咨詢]

開發(fā) 商： IBM

正式授權

">IBM InfoSphere Streams

高效捕獲和分析動態(tài)數(shù)據(jù)的軟件平臺

軟件

產品功能：大數(shù)據(jù)分析工具

源碼：非開源

產品編號：13812

當前版本： [銷售以商家最新版為準，如需其他版本，請來電咨詢]

開發(fā) 商： IBM

正式授權

">Watson Analytics

具備理解，學習和推理能力，實現(xiàn)更智能的人機互動，幫助人們做出更好的決策

最新文章 MORE

金喜正規(guī)買球相關的文章 MORE

国产精品青草久-国产精品情侣愉拍-国产精品区网红主-国产精品区一区二-国产精品热久久-国产精品热热热-国产精品人aⅴ-国产精品人成在线-国产精品人妻人伦-国产精品人人

金喜正规买球

在線采購

中文文檔庫

試用/Demo下載

開發(fā)社群

干貨丨23個適合Java開發(fā)者的大數(shù)據(jù)工具和框架

用科技創(chuàng)就卓越

Create excellence with technology

国产精品青草久-国产精品情侣愉拍-国产精品区网红主-国产精品区一区二-国产精品热久久-国产精品热热热-国产精品人aⅴ-国产精品人成在线-国产精品人妻人伦-国产精品人人

金喜正规买球

在線采購

中文文檔庫

試用/Demo下載

開發(fā)社群

干貨丨23個適合Java開發(fā)者的大數(shù)據(jù)工具和框架

為你推薦

用科技創(chuàng)就卓越

Create excellence with technology