在數(shù)據(jù)可視化中,條形圖是一種經常被用到的圖表,但是條形圖也有臃腫、不夠直觀等問題。棒棒糖圖表就是一種條形圖的改進,他可以更清晰明了的表達我們的數(shù)據(jù)。那么怎么使用python繪制棒棒糖圖表呢,接下來這篇文章帶你了解。
使用到的是我國1949到2019年,歷年的出生人口數(shù)據(jù),數(shù)據(jù)來源國家統(tǒng)計局。
首先讀取一下數(shù)據(jù)。
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數(shù)據(jù)
df = pd.read_csv('data.csv')
print(df)
結果如下。
數(shù)據(jù)集很簡單,每行都只有一個年份和一個值。
先繪制一個帶有每年數(shù)值的條形圖。
# 繪制柱狀圖
plt.bar(df.Year, df.value)
plt.show()
兩行代碼,即可得到一張條形圖圖表,看起來確實是有點擁擠。
下面將最后一年,即2019年的數(shù)據(jù)區(qū)分出來。
給2019年的條形著色為黑色,其他年份為淺灰色。
并且在圖表中添加散點圖,可在條形圖的頂部繪制圓形。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設置
colors = ['black'] + ((n-1)*['lightgrey'])
plt.bar(df.Year, df.value, color=colors)
plt.scatter(df.Year, df.value, color=colors)
plt.show()
得到結果如下。
顏色已經修改成功,還需要調整一下條形圖的寬度以及頂部圓圈的大小。
# width: 條形圖寬度 s: 散點圖圓圈大小
plt.bar(df.Year, df.value, color=colors, width=0.2)
plt.scatter(df.Year, df.value, color=colors, s=10)
plt.show()
結果如下。
比起先前的藍色條形圖圖表,棒棒糖圖表確實是好看了不少。
除了用條形圖來繪制棒棒糖圖表,還可以使用線條,這樣整體的寬度會更加一致。
X將Year(年份)數(shù)據(jù)作為起點和終點,Y以-20和各年份數(shù)據(jù)作為起點和終點。
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數(shù)據(jù)
df = pd.read_csv('data.csv')
print(df)
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx])
plt.show()
得到結果如下。
可以使用參數(shù)標記在兩端繪制圓,而不是只在頂部生成散點圖。
然后可以通過更改y-limit參數(shù)來隱藏最底端的圓。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條, markersize設置標記點大小
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
markersize=3)
# 設置y軸最低值
plt.ylim(0,)
plt.show()
結果如下。
此外還可以調整lw、markersize參數(shù),定義線條的粗細及標記的大小,甚至可以繪制兩次線條以創(chuàng)建輪廓效果。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
color = 'b'
# 年份數(shù)
n = len(df)
# 顏色設置
colors = ['black'] + ((n-1)*['lightgrey'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color='black',
marker='o',
lw=4,
markersize=6)
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
markersize=4)
# 移除上邊框、右邊框
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
# 設置x、y軸范圍
plt.xlim(1948, 2020)
plt.ylim(0,)
# 中文顯示
plt.rcParams['font.sans-serif'] = ['Songti SC']
plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
plt.text(2019, -220, '來源:國家統(tǒng)計局', ha='right')
# 2019年出生人口數(shù)(顯示)
value_2019 = df[df['Year'] == 2019].value.values[0]
plt.text(2019, value_2019+80, value_2019, ha='center')
# 保存圖片
plt.savefig('chart.png')
得到結果如下。
黑色不是特別好看,改個顏色看看。
# 新建畫布
fig, ax = plt.subplots(1, figsize=(12, 8))
# 年份數(shù)
n = len(df)
# 顏色設置
color = 'b'
colors = ['#E74C3C'] + ((len(df)-1)*['#F5B7B1'])
# 使用線條
for idx, val in df.iterrows():
plt.plot([val.Year, val.Year],
[-20, val.value],
color=colors[idx],
marker='o',
lw=4,
markersize=6,
markerfacecolor='#E74C3C')
# 移除上邊框、右邊框
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
# 設置x、y軸范圍
plt.xlim(1948, 2020)
plt.ylim(0,)
# 中文顯示
plt.rcParams['font.sans-serif'] = ['Songti SC']
plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
plt.text(2019, -220, '來源:國家統(tǒng)計局', ha='right')
# 2019年出生人口數(shù)(顯示)
value_2019 = df[df['Year'] == 2019].value.values[0]
plt.text(2019, value_2019+80, value_2019, ha='center')
# 保存圖片
plt.savefig('chart.png')
得到結果如下。
源碼地址:
鏈接:https://pan.baidu.com/s/1vUgjonTOvgN7rDPx_8RfUg 密碼:i613
現(xiàn)在對于條形圖,你就有了另外一個選擇,即棒棒糖圖表。
此外我們也能了解到目前中國的新出生人口數(shù)量是越來越少,據(jù)說2020年出生人口降幅或超一成,未來幾年恐跌破1000萬...
以上就是怎么使用python繪制棒棒糖圖表的詳細內容,更多Python學習資料請關注W3Cschool其它相關文章!