很多小伙伴都知道,python是由其他語(yǔ)言進(jìn)行實(shí)現(xiàn)的,其中最廣泛的實(shí)現(xiàn)是用C語(yǔ)言進(jìn)行實(shí)現(xiàn)的。今天我們就以列表為例,來(lái)介紹一下python列表如何實(shí)現(xiàn)(內(nèi)附python列表源代碼)。
一、列表結(jié)構(gòu)體
創(chuàng)建列表C語(yǔ)言底層的結(jié)構(gòu)體
lists = []
list.append('name')
list.append('age')
list.append('grade')
typedef struct{
struct _object *_ob_next;
struct _object *_ob_prev; // python內(nèi)部將對(duì)象放在鏈表進(jìn)行內(nèi)存管理
Py_ssize_t ob_refcnt; // 引用計(jì)數(shù)器,就是多少變量用了它
PyObject **ob_item; // 指針的指針,存列表的元素
Py_ssize_t ob_size; // 已有元素個(gè)數(shù)
Py_ssize_t allocated; // 列表容量,可容納個(gè)數(shù)
} PyListObject;
c源碼來(lái)自 listobject.c
二、創(chuàng)建列表
name_list = [ ]
PyObject *
PyList_New(Py_ssize_t size)
{
PyListObject *op;
size_t nbytes;
#ifdef SHOW_ALLOC_COUNT
static int initialized = 0;
if (!initialized) {
Py_AtExit(show_alloc);
initialized = 1;
}
#endif
// 緩存機(jī)制
if (size < 0) {
PyErr_BadInternalCall();
return NULL;
}
/* Check for overflow without an actual overflow,
* which can cause compiler to optimise out */
if ((size_t)size > PY_SIZE_MAX / sizeof(PyObject *))
return PyErr_NoMemory();
nbytes = size * sizeof(PyObject *);
if (numfree) {
numfree--;
op = free_list[numfree];
_Py_NewReference((PyObject *)op);
#ifdef SHOW_ALLOC_COUNT
count_reuse++;
#endif
} else {
op = PyObject_GC_New(PyListObject, &PyList_Type);
if (op == NULL)
return NULL;Py
#ifdef SHOW_ALLOC_COUNT
count_alloc++;
#endif
}
if (size <= 0)
op->ob_item = NULL;
else {
op->ob_item = (PyObject **) PyMem_MALLOC(nbytes);
if (op->ob_item == NULL) {
Py_DECREF(op);
return PyErr_NoMemory();
}
memset(op->ob_item, 0, nbytes);
}
Py_SIZE(op) = size; // 元素個(gè)數(shù)
op->allocated = size; // 容量
_PyObject_GC_TRACK(op); //放到雙向鏈表進(jìn)行維護(hù)
return (PyObject *) op; //返回列表的指針
}
三、添加元素
list中插入一個(gè)元素時(shí),擴(kuò)容連續(xù)的內(nèi)存地址(容量),在內(nèi)存創(chuàng)建需要插入的內(nèi)容p,將地址*p放入list的空間中,所以,PyListObject的ob_item是指針的指針
擴(kuò)容的曲線一般就是0,4,8,16,24…
// 添加元素
static int
app1(PyListObject *self, PyObject *v)
{
// 獲取實(shí)際元素個(gè)數(shù)
Py_ssize_t n = PyList_GET_SIZE(self);
assert (v != NULL);
if (n == PY_SSIZE_T_MAX) {
PyErr_SetString(PyExc_OverflowError,
"cannot add more objects to list");
return -1;
}
// 計(jì)算當(dāng)前容量和內(nèi)部元素個(gè)數(shù)
// 直接添加元素/擴(kuò)容添加
if (list_resize(self, n+1) == -1)
return -1;
// 將元素添加到ob_item,v
Py_INCREF(v);
PyList_SET_ITEM(self, n, v);
return 0;
}
- 擴(kuò)容
// 擴(kuò)容機(jī)制
// newsize: 已存在元素個(gè)數(shù)+1
static int
list_resize(PyListObject *self, Py_ssize_t newsize)
{
PyObject **items;
size_t new_allocated;
Py_ssize_t allocated = self->allocated; // 當(dāng)前的容量
// 1,容量大于個(gè)數(shù)
// 2,個(gè)數(shù)大于容量的一半(容量足夠且沒有內(nèi)存浪費(fèi))
if (allocated >= newsize && newsize >= (allocated >> 1)) {
assert(self->ob_item != NULL || newsize == 0);
Py_SIZE(self) = newsize;
return 0;
}
/*
* The growth pattern is: 0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...
*/
// 擴(kuò)容機(jī)制的算法
new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6);
/* check for integer overflow */
if (new_allocated > PY_SIZE_MAX - newsize) {
PyErr_NoMemory();
return -1;
} else {
new_allocated += newsize;
}
if (newsize == 0)
new_allocated = 0;
// 擴(kuò)容/縮容(涉及原來(lái)元素的遷移)
items = self->ob_item;
if (new_allocated <= (PY_SIZE_MAX / sizeof(PyObject *)))
PyMem_RESIZE(items, PyObject *, new_allocated);
else
items = NULL;
if (items == NULL) {
PyErr_NoMemory();
return -1;
}
// 賦值,更新個(gè)數(shù)和容量
self->ob_item = items;
Py_SIZE(self) = newsize;
self->allocated = new_allocated;
return 0;
}
四、移除元素
list.pop()
刪除最后一個(gè)元素只需要修改size,不需要清除數(shù)據(jù),下次append可以直接覆蓋這個(gè)位置
指定索引位置移除后,向前補(bǔ)位
static PyObject *
listpop(PyListObject *self, PyObject *args)
{
Py_ssize_t i = -1;
PyObject *v;
int status;
if (!PyArg_ParseTuple(args, "|n:pop", &i))
return NULL;
if (Py_SIZE(self) == 0) {
/* Special-case most common failure cause */
PyErr_SetString(PyExc_IndexError, "pop from empty list");
return NULL;
}
if (i < 0)
i += Py_SIZE(self);
if (i < 0 || i >= Py_SIZE(self)) {
PyErr_SetString(PyExc_IndexError, "pop index out of range");
return NULL;
}
v = self->ob_item[i];
// 刪除最后一個(gè),僅改變size
if (i == Py_SIZE(self) - 1) {
status = list_resize(self, Py_SIZE(self) - 1);
assert(status >= 0);
return v; /* and v now owns the reference the list had */
}
Py_INCREF(v);
// 不是最后一個(gè),需要移動(dòng)數(shù)據(jù)位置
status = list_ass_slice(self, i, i+1, (PyObject *)NULL);
assert(status >= 0);
/* Use status, so that in a release build compilers don't
* complain about the unused name.
*/
(void) status;
return v;
}
五、清空
list.clear()
static int
list_clear(PyListObject *a)
{
Py_ssize_t i;
PyObject **item = a->ob_item;
if (item != NULL) {
i = Py_SIZE(a);
// 各個(gè)元素設(shè)置為空
Py_SIZE(a) = 0;
a->ob_item = NULL;
a->allocated = 0;
// 引用計(jì)數(shù)器-1
while (--i >= 0) {
Py_XDECREF(item[i]);
}
PyMem_FREE(item);
}
return 0;
}
六、銷毀
del list
銷毀列表對(duì)象的操作
將列表的引用計(jì)數(shù)-1
引用計(jì)數(shù)>0,還有應(yīng)用的話不做操作
引用計(jì)數(shù)=0,沒人使用
- 處理列表的元素,將所有引用計(jì)數(shù)-1(GC回收0計(jì)數(shù))
- ob_item=0,ob_size=0,ob_allocated=0
- 將列表從雙向鏈表移除,可以銷毀
- 為了提高效率,Python結(jié)束期在內(nèi)部為free_list緩存80個(gè)list,存放無(wú)使用的list,再創(chuàng)建的時(shí)候直接從緩存中拿來(lái)初始化。如果已經(jīng)存了80個(gè),del 的時(shí)候直接在內(nèi)存中銷毀對(duì)象
static void
list_dealloc(PyListObject *op)
{
Py_ssize_t i;
// 判斷引用計(jì)數(shù)是否為0
PyObject_GC_UnTrack(op);
Py_TRASHCAN_SAFE_BEGIN(op)
if (op->ob_item != NULL) {
i = Py_SIZE(op);
while (--i >= 0) {
Py_XDECREF(op->ob_item[i]);
}
PyMem_FREE(op->ob_item);
}
// free_list沒有80個(gè)的話緩存這個(gè)list
if (numfree < PyList_MAXFREELIST && PyList_CheckExact(op))
free_list[numfree++] = op;
else
Py_TYPE(op)->tp_free((PyObject *)op);
Py_TRASHCAN_SAFE_END(op)
}
就是說(shuō)創(chuàng)建列表時(shí),實(shí)際上不會(huì)直接開辟內(nèi)存,而是先看看free_list
# 兩次list的地址相同
>>> list1=[1,2,3]
>>> id(list1)
69070216L
>>> del list1
>>> list2=[0,0,0]
>>> id(list2)
69303304L
>>>
到此這篇C語(yǔ)言實(shí)現(xiàn)python列表的文章就介紹到這了,更多Python相關(guān)的學(xué)習(xí)內(nèi)容請(qǐng)前往W3Cschool進(jìn)行學(xué)習(xí)!