Pandas是一個(gè)開(kāi)源的,BSD許可的庫(kù),為Python編程語(yǔ)言提供高性能,易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。 Pandas是NumFOCUS贊助的項(xiàng)目。這將有助于確保Pandas成為世界級(jí)開(kāi)源項(xiàng)目的成功,并有可能捐贈(zèng)給該項(xiàng)目。
Pandas 是 Python 的核心數(shù)據(jù)分析支持庫(kù),提供了快速、靈活、明確的數(shù)據(jù)結(jié)構(gòu),旨在簡(jiǎn)單、直觀(guān)地處理關(guān)系型、標(biāo)記型數(shù)據(jù)。Pandas 的目標(biāo)是成為 Python 數(shù)據(jù)分析實(shí)踐與實(shí)戰(zhàn)的必備高級(jí)工具,其長(zhǎng)遠(yuǎn)目標(biāo)是成為最強(qiáng)大、最靈活、可以支持任何語(yǔ)言的開(kāi)源數(shù)據(jù)分析工具。經(jīng)過(guò)多年不懈的努力,Pandas 離這個(gè)目標(biāo)已經(jīng)越來(lái)越近了。
Pandas 適用于處理以下類(lèi)型的數(shù)據(jù):
Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series(一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì)、社會(huì)科學(xué)、工程等領(lǐng)域里的大多數(shù)典型用例。對(duì)于 R 用戶(hù),DataFrame 提供了比 R 語(yǔ)言 data.frame 更豐富的功能。Pandas 基于 NumPy 開(kāi)發(fā),可以與其它第三方科學(xué)計(jì)算支持庫(kù)完美集成。
Pandas 就像一把萬(wàn)能瑞士軍刀,下面僅列出了它的部分優(yōu)勢(shì) :
這些功能主要是為了解決其它編程語(yǔ)言、科研環(huán)境的痛點(diǎn)。處理數(shù)據(jù)一般分為幾個(gè)階段:數(shù)據(jù)整理與清洗、數(shù)據(jù)分析與建模、數(shù)據(jù)可視化與制表,Pandas 是處理數(shù)據(jù)的理想工具。
其它說(shuō)明:
掃描下方二維碼或打開(kāi)微信搜一搜“w3cschool編程獅”關(guān)注公眾號(hào)回復(fù)關(guān)鍵詞【Python123】或者【Python資料包】免費(fèi)領(lǐng)取 Python 學(xué)習(xí)資料,包含軟件安裝包,電子書(shū)、思維導(dǎo)圖等