翻譯|使用教程|編輯:吳園園|2019-08-20 15:10:38.270|閱讀 4744 次
概述:本篇教程將結(jié)合數(shù)據(jù)為您展示在PyCharm 2019.2中集成Jupyter Notebooks。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
Jetbrains交流群現(xiàn)已開通,QQ搜索群號(hào)786598704即可加入!
PyCharm是一種Python IDE,其帶有一整套可以幫助用戶在使用Python語言開發(fā)時(shí)提高其效率的工具。此外,該IDE提供了一些高級(jí)功能,以用于Django框架下的專業(yè)Web開發(fā)。
嗨,您好!您是否嘗試過在PyCharm 2019.2中集成Jupyter Notebooks?趕快來嘗試一下吧!在這篇博文中,我們將使用PyCharm及其Jupyter Notebook集成來探索一些數(shù)據(jù)。首先,我們需要所述數(shù)據(jù)。每當(dāng)我需要一個(gè)新的數(shù)據(jù)集來玩時(shí),我通常會(huì)前往Kaggle,我肯定會(huì)找到一些有趣的主題。這一次,一個(gè)名為“ 披薩餐館和他們賣的比薩餅 ”的數(shù)據(jù)集引起了我的注意。誰不喜歡披薩?讓我們分析一下這些披薩店,并嘗試從中學(xué)到一兩件事。
點(diǎn)擊下載PyCharm專業(yè)版2019.2最新試用版
由于這些數(shù)據(jù)不是我現(xiàn)有任何PyCharm項(xiàng)目的一部分,我將創(chuàng)建一個(gè)新項(xiàng)目。
確保使用PyCharm專業(yè)版,Community Edition不包括Jupyter筆記本集成。
提示:在瀏覽器中使用Jupyter Notebooks時(shí),我傾向于為實(shí)驗(yàn)創(chuàng)建多個(gè)臨時(shí)筆記本。為每個(gè)項(xiàng)目創(chuàng)建一個(gè)PyCharm項(xiàng)目是相當(dāng)繁瑣的,所以相反,你可以有一個(gè)項(xiàng)目用于這樣的實(shí)驗(yàn)。
我喜歡我的東西井然有序,所以一旦項(xiàng)目被創(chuàng)建,我將添加一些結(jié)構(gòu) - 我將移動(dòng)下載的數(shù)據(jù)集的數(shù)據(jù)目錄,以及筆記本的另一個(gè)目錄。
一旦我創(chuàng)建了我的第一個(gè)pizza.ipynb筆記本,PyCharm建議安裝Jupyter包并在右上角提供一個(gè)鏈接來做到這一點(diǎn)。
一旦安裝了Jupyter軟件包,我們就準(zhǔn)備好了!
90%的數(shù)據(jù)科學(xué)家在他們的Jupyter筆記本中做的第一件事是打字import pandas as pd。此時(shí),PyCharm會(huì)建議在這個(gè)venv中安裝pandas,只需單擊即可完成:
一旦我們安裝了pandas,我們就可以將csv中的數(shù)據(jù)讀入pandas DataFrame:
df = pd.read_csv("../data/Datafiniti_Pizza_Restaurants_and_the_Pizza_They_Sell_May19.csv")
要執(zhí)行此單元格,請(qǐng)按Shift + Enter,或單擊單元格旁邊的裝訂線中的綠色箭頭圖標(biāo)。
當(dāng)您第一次運(yùn)行單元格時(shí),PyCharm將啟動(dòng)一個(gè)本地Jupyter服務(wù)器來執(zhí)行其中的代碼 - 您無需從終端手動(dòng)執(zhí)行此操作。
首先,我們將了解該數(shù)據(jù)集的基本內(nèi)容 - 它有多少行?列是什么?數(shù)據(jù)是什么樣的?
我懷疑這些數(shù)據(jù)僅包含美國餐館的信息。要確認(rèn)這一點(diǎn),讓我們計(jì)算國家/地區(qū)列中的值:
是的,這個(gè)數(shù)據(jù)集中唯一出現(xiàn)的國家是美國,因此country完全刪除該列是安全的。同樣的,menus.currency和priceRangeCurrency那些價(jià)值也是一樣的 - 美元。我也會(huì)放棄,menuPageURL因?yàn)樗粫?huì)給分析增加太多價(jià)值,key因?yàn)樗鼤?huì)復(fù)制其他列(國家,州,城市等)的信息。
我將在這里做的另一個(gè)清理是重命名province列,states因?yàn)樗谶@個(gè)上下文中更有意義,為了更好的可讀性,我將用狀態(tài)的全名替換狀態(tài)首字母縮略詞。
一旦我們完成清理數(shù)據(jù),我們?nèi)绾卫L制它?作為人類,我們更善于在視覺上呈現(xiàn)信息。
首先,讓我們看看我們?cè)谶@個(gè)數(shù)據(jù)集中最常見的披薩類型。鑒于主題,將它視為帶有matplotlib的餡餅是合適的
現(xiàn)在還不是我們的餡餅圖。為了讓它顯示,我需要%matplotlib inline為IPython 添加魔術(shù)命令,當(dāng)我在它時(shí),我將添加另一個(gè)魔術(shù)命令讓IPython知道為視網(wǎng)膜屏幕適當(dāng)?shù)劁秩緢D。
我可以將這些行添加到同一個(gè)單元格并再次運(yùn)行它,但我更喜歡在筆記本的最開始定義這種類型的魔術(shù)命令。
要導(dǎo)航到筆記本的最開頭,您可以使用 Cmd+[ (Ctrl+Alt+Left on Windows)。插入新單元格就像鍵入一樣簡(jiǎn)單#%%(如果您更喜歡在當(dāng)前單元格上方插入單元格的快捷方式,Option+Shift+Aon mac, or Alt+Shift+A on Windows)。現(xiàn)在我需要做的就是添加魔術(shù)命令并運(yùn)行下面的所有單元格:
由餡餅圖可知,現(xiàn)在我們知道最常見的披薩類型是芝士披薩,緊隨其后的是白披薩。
餐館怎么樣?我們?cè)跀?shù)據(jù)集中有他們的地理位置,因此我們可以很容易地看到他們所在的位置。
每個(gè)餐廳都有一個(gè)唯一的ID,并且數(shù)據(jù)集中可以有多個(gè)條目,每個(gè)條目代表該餐廳菜單中的披薩。因此,為了繪制餐廳而不是比薩餅,我們需要按餐館ID對(duì)條目進(jìn)行分組。
現(xiàn)在我們可以在地圖上繪制它們。對(duì)于地理繪圖,我喜歡用情節(jié)。確保獲取它的最新版本(4.0.0),以便在PyCharm中很好地渲染圖形輸出。
人們可以想到我們可以嘗試用這個(gè)數(shù)據(jù)集來回答的一些問題,例如,哪個(gè)城市擁有最多/最便宜的Veggie Pizza?或者最常見的比薩餐廳連鎖店是什么?如果您想玩這個(gè)數(shù)據(jù)集并回答這些或其他問題,您可以搜集數(shù)據(jù)并運(yùn)行您自己的分析。請(qǐng)記住,如果你想用PyCharm試試,請(qǐng)確保你使用的是PyCharm 2019.2專業(yè)版。
更多PyCharm相關(guān)教程資源請(qǐng)點(diǎn)擊此處進(jìn)行了解~
想要購買PyCharm正版授權(quán)的朋友可以。
更多精彩內(nèi)容,敬請(qǐng)關(guān)注下方的微信公眾號(hào),及時(shí)獲取產(chǎn)品最新資訊▼▼▼
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自: