使AI第一企業(yè)能夠通過自助服務(wù)訪問受控數(shù)據(jù)。
標(biāo)簽:開發(fā)商: Cloudera
產(chǎn)品類型:軟件
產(chǎn)品功能:大數(shù)據(jù)分析工具
平臺語言:
開源水平:不提供源碼
本產(chǎn)品的分類與介紹僅供參考,具體以商家網(wǎng)站介紹為準(zhǔn),如有疑問請來電 023-68661681 咨詢。
全球第二大軟件公司
全面,凝聚的用戶體驗
數(shù)據(jù)可任意移動
便捷的ML工作區(qū)
* 關(guān)于本產(chǎn)品的分類與介紹僅供參考,精準(zhǔn)產(chǎn)品資料以官網(wǎng)介紹為準(zhǔn),如需購買請先行測試。
Cloudera Machine Learning(CML)只是您可以在Cloudera數(shù)據(jù)平臺(CDP)上使用的眾多體驗之一。 Cloudera Machine Learning使團(tuán)隊可以立即部署機器學(xué)習(xí)工作空間,這些工作空間可以自動擴展以適應(yīng)他們的需求,并可以通過使用kubernetes自動掛起以節(jié)省成本。 所有這些都打包成可移植的體驗,多個團(tuán)隊成員可以輕松訪問這些體驗,以在整個組織中提供一致的體驗。在下面的視頻中,將帶您逐步了解CDP公共云上CML中的各種高級功能。
|
|
|
對于數(shù)據(jù)科學(xué)家 |
|
|
在可滿足您的業(yè)務(wù)和IT要求的平臺上獲取端到端機器學(xué)習(xí)工作流所需的訪問,工具和計算資源。 |
|
|
|
|
對于IT領(lǐng)導(dǎo)者 |
|
|
在不影響安全性和治理的前提下,為您的團(tuán)隊提供通過機器學(xué)習(xí)進(jìn)行試驗,迭代和影響業(yè)務(wù)所需的資源。
|
借助Cloudera Machine Learning,管理員可以輕松地在混合和多云環(huán)境中復(fù)制受控數(shù)據(jù)集,以使數(shù)據(jù)科學(xué)團(tuán)隊可以自助訪問他們所需的業(yè)務(wù)數(shù)據(jù),同時保持企業(yè)數(shù)據(jù)安全性和治理控制。
Cloudera Machine Learning使數(shù)據(jù)科學(xué)團(tuán)隊可以訪問橫向擴展的異構(gòu)計算資源,以快速完成工作,同時維護(hù)可調(diào)節(jié)的護(hù)欄,以幫助IT部門輕松管理和優(yōu)化基礎(chǔ)架構(gòu)資源和成本。
除了適用于Spark的Python,R和Scala之外,現(xiàn)代數(shù)據(jù)科學(xué)團(tuán)隊還需要最新的開源工具和庫來進(jìn)行創(chuàng)新,并在首選IDE中進(jìn)行協(xié)作。Cloudera機器學(xué)習(xí)使從業(yè)人員可以自由使用自己喜歡的工具,同時保持安全性,效率和可擴展性,而無需管理開銷。
當(dāng)在本地訓(xùn)練ML模型但推理數(shù)據(jù)存儲在云中時,可以對駐留在云存儲中的大量數(shù)據(jù)進(jìn)行批評分。IT部門可以使用預(yù)先配置的資源利用防護(hù)欄來部署ML工作區(qū),數(shù)據(jù)科學(xué)團(tuán)隊則使用自動縮放/掛起的TensorFlow/Spark作業(yè)快速處理數(shù)據(jù),不會損失任何成本。
CML是Cloudera Machine Learning,CDSW是Cloudera Data Science Workbench。對于現(xiàn)有的Cloudera Data Science Workbench用戶,本主題將有助于重點介紹Cloudera Data Science Workbench與它的原生云產(chǎn)品Cloudera Machine Learning之間的一些關(guān)鍵區(qū)別。
CML利用云原生優(yōu)勢(如快速配置,彈性自動縮放,分布式依賴項隔離和分布式GPU培訓(xùn))擴展了Cloudera Data Science Workbench(CDSW)的端到端工作流。它可以運行自己的本機分布式計算工作負(fù)載,而無需單獨的CDH群集進(jìn)行橫向擴展計算。 它旨在在現(xiàn)有Kubernetes環(huán)境中的CDP上運行,例如托管云Kubernetes服務(wù)(EKS,AKS,GKE)或Red Hat OpenShift,從而在提供多云可移植性的同時為某些客戶降低了運營成本。
兩種產(chǎn)品都可以幫助數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)團(tuán)隊通過強大的安全性和治理來提高共享數(shù)據(jù)和計算的生產(chǎn)力,他們共享大量的代碼。
主要區(qū)別在于:
CDSW | CML | |
---|---|---|
結(jié)構(gòu) | CDSW需要CDH或HDP群集,并在群集上的一個或多個專用網(wǎng)關(guān)節(jié)點上運行。 | CML是自包含的,不需要附加的CDH / HDP群集。 |
1個主主機和多個工作主機的概念。 | 沒有指定的主機和工作主機;所有節(jié)點都是短暫的。 | |
安全性 | 通過CDH / HDP集群集成了Kerberos身份驗證;通過LDAP / SAML進(jìn)行外部身份驗證。 | 通過Cloudera數(shù)據(jù)平臺(CDP)使用FreeIPA進(jìn)行集中身份管理。 |
應(yīng)用存儲 | 項目文件,內(nèi)部postgresDB和Livelog都永久存儲在Master主機上。 | 所有必需的持久性存儲都在云托管的塊存儲,NFS和關(guān)系數(shù)據(jù)存儲中。 |
計算 | Python / R / Scala工作負(fù)載在集群的CDSW網(wǎng)關(guān)節(jié)點上執(zhí)行。 | Python / R / Scala工作負(fù)載在CDP /云提供商管理的K8s集群上運行。 |
CDSW將分布式計算工作負(fù)載(例如YARN上的Spark)推送到CDH / HDP集群。 | 不支持Spark-on-YARN;改為使用Spark-on-K8s 。工作負(fù)載將在客戶環(huán)境中配置的專用K8s集群上運行。 | |
沒有自動縮放。 | 通過您的云服務(wù)提供商進(jìn)行自動擴展。Kubernetes /節(jié)點級自動縮放將用于根據(jù)需求擴展/收縮集群大小。 | |
打包 | 作為可下載的RPM和CSD提供。 | 作為CDP上的托管服務(wù)提供。 |
Spark與CDH打包在一起。 | K8s上的Spark與CML打包在一起,不依賴于外部集群。 | |
資料存取 | 數(shù)據(jù)通常駐留在HDFS,Hive,HBase等中的附加CDH / HDP群集上。 | 數(shù)據(jù)可以駐留在對象存儲(例如S3)上,也可以駐留在向CDP注冊的任何現(xiàn)有工作負(fù)載群集上。 |
管理駕駛艙
為企業(yè)提供生產(chǎn)產(chǎn)能、設(shè)備維護(hù)、市場營銷、庫存管理、財務(wù)等分析和預(yù)測,突破管理盲區(qū),建企業(yè)運營決策系統(tǒng)。
了解更多產(chǎn)品質(zhì)量分析及預(yù)測方案
為企業(yè)提供質(zhì)量與缺陷走勢、客訴與訂單、設(shè)備故障與備件等分析和預(yù)測,找到人員、環(huán)境等影響產(chǎn)品質(zhì)量的關(guān)鍵因素。
了解更多設(shè)備故障分析及預(yù)測方案
針對設(shè)備故障、設(shè)備維修情況等數(shù)據(jù)分析和預(yù)測,優(yōu)化設(shè)備維修維護(hù)計劃、備件采購計劃,降低設(shè)備維護(hù)成本和生產(chǎn)損失。
了解更多慧都大數(shù)據(jù)分析平臺
為企業(yè)提供大數(shù)據(jù)管理和分析項目的咨詢、實施等專業(yè)服務(wù),定制數(shù)據(jù)收集、管理、分析的端到端解決方案,實現(xiàn)企業(yè)分析目標(biāo)。
了解更多
更新時間:2020-06-24 11:08:30.000 | 錄入時間:2020-05-07 11:16:09.313 | 責(zé)任編輯:胡濤