在數(shù)據(jù)可視化中,條形圖是一種經(jīng)常被用到的圖表,但是條形圖也有臃腫、不夠直觀等問題。棒棒糖圖表就是一種條形圖的改進(jìn),他可以更清晰明了的表達(dá)我們的數(shù)據(jù)。那么怎么使用python繪制棒棒糖圖表呢,接下來這篇文章帶你了解。
使用到的是我國1949到2019年,歷年的出生人口數(shù)據(jù),數(shù)據(jù)來源國家統(tǒng)計(jì)局。
首先讀取一下數(shù)據(jù)。
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數(shù)據(jù)
df = pd.read_csv('data.csv')
print(df)
結(jié)果如下。
數(shù)據(jù)集很簡單,每行都只有一個年份和一個值。
先繪制一個帶有每年數(shù)值的條形圖。
# 繪制柱狀圖
plt.bar(df.Year, df.value)
plt.show()
兩行代碼,即可得到一張條形圖圖表,看起來確實(shí)是有點(diǎn)擁擠。
下面將最后一年,即2019年的數(shù)據(jù)區(qū)分出來。
給2019年的條形著色為黑色,其他年份為淺灰色。
并且在圖表中添加散點(diǎn)圖,可在條形圖的頂部繪制圓形。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設(shè)置
colors = ['black'] + ((n-1)*['lightgrey'])
plt.bar(df.Year, df.value, color=colors)
plt.scatter(df.Year, df.value, color=colors)
plt.show()
得到結(jié)果如下。
顏色已經(jīng)修改成功,還需要調(diào)整一下條形圖的寬度以及頂部圓圈的大小。
# width: 條形圖寬度 s: 散點(diǎn)圖圓圈大小
plt.bar(df.Year, df.value, color=colors, width=0.2)
plt.scatter(df.Year, df.value, color=colors, s=10)
plt.show()
結(jié)果如下。
比起先前的藍(lán)色條形圖圖表,棒棒糖圖表確實(shí)是好看了不少。
除了用條形圖來繪制棒棒糖圖表,還可以使用線條,這樣整體的寬度會更加一致。
X將Year(年份)數(shù)據(jù)作為起點(diǎn)和終點(diǎn),Y以-20和各年份數(shù)據(jù)作為起點(diǎn)和終點(diǎn)。
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數(shù)據(jù)
df = pd.read_csv('data.csv')
print(df)
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設(shè)置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx])
plt.show()
得到結(jié)果如下。
可以使用參數(shù)標(biāo)記在兩端繪制圓,而不是只在頂部生成散點(diǎn)圖。
然后可以通過更改y-limit參數(shù)來隱藏最底端的圓。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設(shè)置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條, markersize設(shè)置標(biāo)記點(diǎn)大小
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
markersize=3)
# 設(shè)置y軸最低值
plt.ylim(0,)
plt.show()
結(jié)果如下。
此外還可以調(diào)整lw、markersize參數(shù),定義線條的粗細(xì)及標(biāo)記的大小,甚至可以繪制兩次線條以創(chuàng)建輪廓效果。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
color = 'b'
# 年份數(shù)
n = len(df)
# 顏色設(shè)置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color='black',
marker='o',
lw=4,
markersize=6)
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
markersize=4)
# 移除上邊框、右邊框
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
# 設(shè)置x、y軸范圍
plt.xlim(1948, 2020)
plt.ylim(0,)
# 中文顯示
plt.rcParams['font.sans-serif'] = ['Songti SC']
plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
plt.text(2019, -220, '來源:國家統(tǒng)計(jì)局', ha='right')
# 2019年出生人口數(shù)(顯示)
value_2019 = df[df['Year'] == 2019].value.values[0]
plt.text(2019, value_2019+80, value_2019, ha='center')
# 保存圖片
plt.savefig('chart.png')
得到結(jié)果如下。
黑色不是特別好看,改個顏色看看。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設(shè)置
color = 'b'
colors = ['#E74C3C'] + ((len(df)-1)*['#F5B7B1'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
lw=4,
markersize=6,
markerfacecolor='#E74C3C')
# 移除上邊框、右邊框
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
# 設(shè)置x、y軸范圍
plt.xlim(1948, 2020)
plt.ylim(0,)
# 中文顯示
plt.rcParams['font.sans-serif'] = ['Songti SC']
plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
plt.text(2019, -220, '來源:國家統(tǒng)計(jì)局', ha='right')
# 2019年出生人口數(shù)(顯示)
value_2019 = df[df['Year'] == 2019].value.values[0]
plt.text(2019, value_2019+80, value_2019, ha='center')
# 保存圖片
plt.savefig('chart.png')
得到結(jié)果如下。
源碼地址:
鏈接:https://pan.baidu.com/s/1vUgjonTOvgN7rDPx_8RfUg 密碼:i613
現(xiàn)在對于條形圖,你就有了另外一個選擇,即棒棒糖圖表。
此外我們也能了解到目前中國的新出生人口數(shù)量是越來越少,據(jù)說2020年出生人口降幅或超一成,未來幾年恐跌破1000萬...
以上就是怎么使用python繪制棒棒糖圖表的詳細(xì)內(nèi)容,更多Python學(xué)習(xí)資料請關(guān)注W3Cschool其它相關(guān)文章!