在使用pandas的時候,我們知道,pandas是使用dataFrame來存儲數(shù)據(jù)的,但我們更多情況下是對python的字典操作而不是對dataFrame操作,所以我們需要將dataFrame轉(zhuǎn)換為字典。接下來的這篇文章我們就來了解一下操作吧。
to_dict()方法可以將列名設(shè)置為字典鍵將“ID”列設(shè)置為索引然后轉(zhuǎn)置DataFrame,是實現(xiàn)此目的的一種方法。to_dict()還接受一個'orient'參數(shù),您需要該參數(shù)才能輸出每列的值列表。否則,{index: value}將為每列返回表單的字典。
可以使用以下行完成這些步驟:
>>> df.set_index('ID').T.to_dict('list')
{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}
如果需要不同的字典格式,這里是可能的東方參數(shù)的示例??紤]以下簡單的DataFrame:
>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
>>> df
a b
0 red 0.500
1 yellow 0.250
2 blue 0.125
然后選項如下。
dict - 默認值:列名是鍵,值是索引的字典:數(shù)據(jù)對
>>> df.to_dict('dict')
{'a': {0: 'red', 1: 'yellow', 2: 'blue'},
'b': {0: 0.5, 1: 0.25, 2: 0.125}}
list - 鍵是列名,值是列數(shù)據(jù)列表
>>> df.to_dict('list')
{'a': ['red', 'yellow', 'blue'],
'b': [0.5, 0.25, 0.125]}
系列 - 比如'list',但值是Series
>>> df.to_dict('series')
{'a': 0 red
1 yellow
2 blue
Name: a, dtype: object,
'b': 0 0.500
1 0.250
2 0.125
Name: b, dtype: float64}
split - 將列/數(shù)據(jù)/索引拆分為鍵,值分別為列名,數(shù)據(jù)值分別按行和索引標簽
>>> df.to_dict('split')
{'columns': ['a', 'b'],
'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]],
'index': [0, 1, 2]}
記錄 - 每一行都成為一個字典,其中鍵是列名,值是單元格中的數(shù)據(jù)
>>> df.to_dict('records')
>
[{'a': 'red', 'b': 0.5},
{'a': 'yellow', 'b': 0.25},
{'a': 'blue', 'b': 0.125}]
index - 類似于'records',但是一個字典字典,其中鍵作為索引標簽(而不是列表)
>>> df.to_dict('index')
{0: {'a': 'red', 'b': 0.5},
1: {'a': 'yellow', 'b': 0.25},
2: {'a': 'blue', 'b': 0.125}}
小結(jié)
到此這篇關(guān)于Pandas DataFrame轉(zhuǎn)換為字典的方法的文章就介紹到這了,更多Pandas的其他操作可以關(guān)注W3Cschool以前的文章。