17.3. net_device 結構的詳情

2018-02-24 15:50 更新

17.3.?net_device 結構的詳情

net_device 結構處于網(wǎng)絡驅動層的非常核心的位置并且值得完全的描述. 這個列表描述了所有成員, 更多的是提供了一個參考而不是用來備忘. 本章剩下的部分簡要地描述了每個成員, 一旦它用在例子代碼上, 因此你不需要不停地回看這一節(jié).

17.3.1.?全局信息

結構 net_device 的第一部分是由下面成員組成:

char name[IFNAMSIZ];
設備名子. 如果名子由驅動設置, 包含一個 %d 格式串, register_netdev 用一個數(shù)替換它來形成一個唯一的名子; 分配的編號從 0 開始.

unsigned long state;
設備狀態(tài). 這個成員包括幾個標志. 驅動正常情況下不直接操作這些標志; 相反, 提供了一套實用函數(shù). 這些函數(shù)在我們進入驅動操作后馬上討論這些函數(shù).

struct net_device *next;
全局列表中指向下一個設備的指針. 這個成員驅動不能動.

int (init)(struct net_device dev);
一個初始化函數(shù). 如果設置了這個指針, 這個函數(shù)被 register_netdev 調用來完成對 net_device 結構的初始化. 大部分現(xiàn)代的網(wǎng)絡驅動不再使用這個函數(shù); 相反, 初始化在注冊接口前進行.

17.3.2.?硬件信息

下面的成員包含了相對簡單設備的低層硬件信息. 它們是早期 Linux 網(wǎng)絡的延續(xù); 大部分現(xiàn)代驅動確實使用它們(可能的例外是 if_port ). 我們?yōu)橥暾鹨娫谶@里列出.

unsigned long rmem_end;unsigned long rmem_start;unsigned long mem_end;unsigned long mem_start;
設備內(nèi)存信息. 這些成員持有設備使用的共享內(nèi)存的開始和結束地址. 如果設備有不同的接收和發(fā)送內(nèi)存, mem 成員由發(fā)送內(nèi)存使用, rmem 成員由接收內(nèi)存使用. rmem 成員在驅動之外從不被引用. 慣例上, 設置 end 成員, 所以 end - start 是可用的板上內(nèi)存的數(shù)量.

unsigned long base_addr;
網(wǎng)絡接口的 I/O 基地址. 這個成員, 如同前面的, 由驅動在設備探測時賦值. ifconfig 目錄可用來顯示或修改當前值. base_addr 可以當系統(tǒng)啟動時在內(nèi)核命令行中顯式賦值( 通過 netdev= 參數(shù)), 或者在模塊加載時. 這個成員, 象上面描述過的內(nèi)存成員, 內(nèi)核不使用它們.

unsigned char irq;
安排的中斷號. 當接口被列出時 ifconfig 打印出 dev->irq 的值. 這個值常常在啟動或者加載時間設置并且在后來由 ifconfig 打印.

unsigned char if_port;
在多端口設備中使用的端口. 例如, 這個成員用在同時支持同軸線(IF_PORT_10BASE2)和雙絞線(IF_PORT_100BSAET)以太網(wǎng)連接. 完整的已知端口類型設置定義在 <linux/netdevie.h>.

unsigned char dma;
設備分配的 DMA 通道. 這個成員只在某些外設總線時有意義, 例如 ISA. 它不在設備驅動自身以外使用, 只是為了信息目的( 在 ifconfig ) 中.

17.3.3.?接口信息

有關接口的大部分信息由 ether_setup 函數(shù)正確設置(或者任何其他對給定硬件類型適合的設置函數(shù)). 以太網(wǎng)卡可以依賴這個通用的函數(shù)設置大部分這些成員, 但是 flags 和 dev_addr 成員是特定設備的, 必須在初始化時間明確指定.

一些非以太網(wǎng)接口可以使用類似 ether_setup 的幫助函數(shù). deviers/net/net_init.c 輸出了一些類似的函數(shù), 包括下列:

void ltalk_setup(struct net_device *dev);
設置一個 LocalTalk 設備的成員

void fc_setup(struct net_device *dev);
初始化光通道設備的成員

void fddi_setup(struct net_device *dev);
配置一個光纖分布數(shù)據(jù)接口 (FDDI) 網(wǎng)絡的接口

void hippi_setup(struct net_device *dev);
預備給一個高性能并行接口 (HIPPI) 的高速互連驅動的成員

void tr_setup(struct net_device *dev);
處理令牌環(huán)網(wǎng)絡接口的設置

大部分設備會歸于這些類別中的一類. 如果你的是全新和不同的, 但是, 你需要手工賦值下面的成員:

unsigned short hard_header_len;
硬件頭部長度, 就是, 被發(fā)送報文前面在 IP 頭之前的字節(jié)數(shù), 或者別的協(xié)議信息. 對于以太網(wǎng)接口 hard_header_len 值是 14 (ETH_HLEN).

unsigned mtu;
最大傳輸單元 (MTU). 這個成員是網(wǎng)絡層用作驅動報文傳輸. 以太網(wǎng)有一個 1500 字節(jié)的 MTU (ETH_DATA_LEN). 這個值可用 ifconfig 改變.

unsigned long tx_queue_len;
設備發(fā)送隊列中可以排隊的最大幀數(shù). 這個值由 ether_setup 設置為 1000, 但是你可以改它. 例如, plip 使用 10 來避免浪費系統(tǒng)內(nèi)存( 相比真實以太網(wǎng)接口, plip 有一個低些的吞吐量).

unsigned short type;
接口的硬件類型. 這個 type 成員由 ARP 用來決定接口支持什么樣的硬件地址. 對以太網(wǎng)接口正確的值是 ARPHRD_ETHER, 這是由 ether_setup 設置的值. 可認識的類型定義于 <linux/if_arp.h>.

unsigned char addr_len;unsigned char broadcast[MAX_ADDR_LEN];unsigned char dev_addr[MAX_ADDR_LEN];
硬件 (MAC) 地址長度和設備硬件地址. 以太網(wǎng)地址長度是 6 個字節(jié)( 我們指的是接口板的硬件 ID ), 廣播地址由 6 個 0xff 字節(jié)組成; ether_setup 安排成正確的值. 設備地址, 另外, 必須以特定于設備的方式從接口板讀出, 驅動應當將它拷貝到 dev_addr. 硬件地址用來產(chǎn)生正確的以太網(wǎng)頭, 在報文傳遞給驅動發(fā)送之前. snull 設備不使用物理接口, 它創(chuàng)造自己的硬件接口.

unsigned short flags;int features;
接口標志(下面詳述)

這個 flags 成員是一個位掩碼, 包括下面的位值. IFF_ 前綴代表 "interface flags". 有些標志由內(nèi)核管理, 有些由接口在初始化時設置來表明接口的能力和其他特性. 有效的標志, 對應于 <linux/if.h>, 有:

IFF_UP
對驅動這個標志是只讀的. 內(nèi)核打開它當接口激活并準備號傳送報文時.

IFF_BROADCAST
這個標志(由網(wǎng)絡代碼維護)說明接口允許廣播. 以太網(wǎng)板是這樣.

IFF_DEBUG
這個標識了調試模式. 這個標志用來控制你的 printk 調用的復雜性或者用于其他調試目的. 盡管當前沒有 in-tree 驅動使用這個標志, 它可以通過 ioctl 來設置和重置, 你的驅動可用它. misc-progs/netifdebug 程序可以用來打開或關閉這個標志.

IFF_LOOPBACK
這個標志應當只在環(huán)回接口中設置. 內(nèi)核檢查 IFF_LOOPBACK , 以代替硬連線 lo 名子作為一個特殊接口.

IFF_POINTOPOINT
這個標志說明接口連接到一個點對點鏈路. 它由驅動設置或者, 有時, 由 ifconfig. 例如, plip 和 PPP 驅動設置它.

IFF_NOARP
這個說明接口不能進行 ARP. 例如, 點對點接口不需要運行 ARP, 它只能增加額外的流量卻沒有任何有用的信息. snull 在沒有 ARP 能力的情況下運行, 因此它設置這個標志.

IFF_PROMISC
這個標志設置(由網(wǎng)絡代碼)來激活混雜操作. 缺省地, 以太網(wǎng)接口使用硬件過濾器來保證它們只接收廣播報文和直接到接口硬件地址的報文. 報文嗅探器, 例如 tcpdump, 在接口上設置混雜模式來存取在接口發(fā)送介質上經(jīng)過的所有報文.

IFF_MULTICAST
驅動設置這個標志來表示接口能夠組播發(fā)送. ether_setup 設置 IFF_MULTICAST 缺省地, 因此如果你的驅動不支持組播, 必須在初始化時清除這個標志.

IFF_ALLMULTI
這個標志告知接口接收所有的組播報文. 內(nèi)核在主機進行組播路由時設置它, 前提是 IFF_MULTICAST 置位. IFF_ALLMULTI 對驅動是只讀的. 組播標志在本章后面的"組播"一節(jié)中用到.

IFF_MASTERIFF_SLAVE
這些標志由負載均衡代碼使用. 接口驅動不需要知道它們.

IFF_PORTSELIFF_AUTOMEDIA
這些標志指出設備可以在多個介質類型間切換; 例如, 無屏蔽雙絞線 (UTP) 和 同軸以太網(wǎng)電纜. 如果 IFF_AUTOMEDIA 設置了, 設備自動選擇正確的介質. 特別地, 內(nèi)核一個也不使用這 2 個標志.

IFF_DYNAMIC
這個標志, 由驅動設置, 指出接口的地址能夠變化. 目前內(nèi)核沒有使用.

IFF_RUNNING
這個標志指出接口已啟動并在運行. 它大部分是因為和 BSD 兼容; 內(nèi)核很少用它. 大部分網(wǎng)絡驅動不需要擔心 IFF_RUNNING.

IFF_NOTRAILERS
在 Linux 中不用這個標志, 為了 BSD 兼容才存在.

當一個程序改變 IFF_UP, open 或者 stop 設備方法被調用. 進而, 當 IFF_UP 或者任何別的標志修改了, set_multicast_list 方法被調用. 如果驅動需要進行某些動作來響應標志的修改, 它必須在 set_multicast_list 中采取動作. 例如, 當 IFF_PROMISC 被置位或者復位, set_multicast_list 必須通知板上的硬件過濾器. 這個設備方法的責任在"組播"一節(jié)中講解.

結構 net_device 的特性成員由驅動設置來告知內(nèi)核關于任何的接口擁有的特別硬件能力. 我們將談論一些這些特性; 別的就超出了本書范圍. 完整的集合是:

NETIF_F_SGNETIF_F_FRAGLIST
2 個標志控制發(fā)散/匯聚 I/O 的使用. 如果你的接口可以發(fā)送一個報文, 它由幾個不同的內(nèi)存段組成, 你應當設置 NETIF_F_SG. 當然, 你不得不實際實現(xiàn)發(fā)散/匯聚 I/O( 我們在"發(fā)散/匯聚"一節(jié)中描述如何做 ). NETIF_F_FRAGLIST 表明你的接口能夠處理分段的報文; 在 2.6 中只有環(huán)回驅動做這一點.

注意內(nèi)核不對你的設備進行發(fā)散/匯聚 I/O 操作, 如果它沒有同時提供某些校驗和形式. 理由是, 如果內(nèi)核不得不跨過一個分片的("非線性")的報文來計算校驗和, 它可能也拷貝數(shù)據(jù)并同時接合報文.

NETIF_F_IP_CSUMNETIF_F_NO_CSUMNETIF_F_HW_CSUM
這些標志都是告知內(nèi)核, 不需要給一些或所有的通過這個接口離開系統(tǒng)的報文進行校驗. 如果你的接口可以校驗 IP 報文但是別的不行, 就設置 NETIF_F_IP_CSUM. 如果這個接口不曾要求校驗和, 就設置 NETIF_F_NO_CSUM. 環(huán)回驅動設置了這個標志, snull 也設置; 因為報文只通過系統(tǒng)內(nèi)存?zhèn)魉? 對它們來說沒有機會( 1 跳 )被破壞, 沒有必要校驗它們. 如果你的硬件自己做校驗, 設置 NETIF_F_HW_CWSUM.

NETIF_F_HIGHDMA
設置這個標志, 如果你的設備能夠對高端內(nèi)存進行 DMA. 沒有這個標志, 所有提供給你的驅動的報文在低端內(nèi)存分配.

NETIF_F_HW_VLAN_TXNETIF_F_HW_VLAN_RXNETIF_F_HW_VLAN_FILTERNETIF_F_VLAN_CHALLENGED
這些選項描述你的硬件對 802.1q VLAN 報文的支持. VLAN 支持超出我們本章的內(nèi)容. 如果 VLAN 報文使你的設備混亂( 其實不應該 ), 設置標志 NETIF_F_VLAN_CHALLENGED.

NETIF_F_TSO
如果你的設備能夠進行 TCP 分段卸載, 設置這個標志. TSO 是一個我們在這不涉及的高級特性.

17.3.4.?設備方法

如同在字符和塊驅動的一樣, 每個網(wǎng)絡設備聲明能操作它的函數(shù). 本節(jié)列出能夠對網(wǎng)絡接口進行的操作. 有些操作可以留作 NULL, 別的常常是不被觸動的, 因為 ether_setup 給它們安排了合適的方法.

網(wǎng)絡接口的設備方法可分為 2 組: 基本的和可選的. 基本方法包括那些必需的能夠使用接口的; 可選的方法實現(xiàn)更多高級的不是嚴格要求的功能. 下列是基本方法:

int (open)(struct net_device dev);
打開接口. 任何時候 ifconfig 激活它, 接口被打開. open 方法應當注冊它需要的任何系統(tǒng)資源( I/O 口, IRQ, DMA, 等等), 打開硬件, 進行任何別的你的設備要求的設置.

int (stop)(struct net_device dev);
停止接口. 接口停止當它被關閉. 這個函數(shù)應當恢復在打開時進行的操作.

int (hard_start_xmit) (struct sk_buff skb, struct net_device *dev);
起始報文的發(fā)送的方法. 完整的報文(協(xié)議頭和所有)包含在一個 socket 緩存區(qū)( sk_buff ) 結構. socket 緩存在本章后面介紹.

int (hard_header) (struct sk_buff skb, struct net_device dev, unsigned short type, void daddr, void *saddr, unsigned len);
用之前取到的源和目的硬件地址來建立硬件頭的函數(shù)(在 hard_start_xmit 前調用). 它的工作是將作為參數(shù)傳給它的信息組織成一個合適的特定于設備的硬件頭. eth_header 是以太網(wǎng)類型接口的缺省函數(shù), ether_setup 針對性地對這個成員賦值.

int (rebuild_header)(struct sk_buff skb);
用來在 ARP 解析完成后但是在報文發(fā)送前重建硬件頭的函數(shù). 以太網(wǎng)設備使用的缺省的函數(shù)使用 ARP 支持代碼來填充報文缺失的信息.

void (tx_timeout)(struct net_device dev);
由網(wǎng)絡代碼在一個報文發(fā)送沒有在一個合理的時間內(nèi)完成時調用的方法, 可能是丟失一個中斷或者接口被鎖住. 它應當處理這個問題并恢復報文發(fā)送.

struct net_device_stats (get_stats)(struct net_device *dev);
任何時候當一個應用程序需要獲取接口的統(tǒng)計信息, 調用這個方法. 例如, 當 ifconfig 或者 netstat -i 運行時. snull 的一個例子實現(xiàn)在"統(tǒng)計信息"一節(jié)中介紹.

int (set_config)(struct net_device dev, struct ifmap *map);
改變接口配置. 這個方法是配置驅動的入口點. 設備的 I/O 地址和中斷號可以在運行時使用 set_config 來改變. 這種能力可由系統(tǒng)管理員在接口沒有探測到時使用. 現(xiàn)代硬件正常的驅動一般不需要實現(xiàn)這個方法.

剩下的設備操作是可選的:

int weight;int (poll)(struct net_device dev; int *quota);
由適應 NAPI 的驅動提供的方法, 用來在查詢模式下操作接口, 中斷關閉著. NAPI ( 以及 weight 成員) 在"接收中斷緩解"一節(jié)中涉及.

void (poll_controller)(struct net_device dev);
在中斷關閉的情況下, 要求驅動檢查接口上的事件的函數(shù). 它用于特殊的內(nèi)核中的網(wǎng)絡任務, 例如遠程控制臺和使用網(wǎng)絡的內(nèi)核調試.

int (do_ioctl)(struct net_device dev, struct ifreq *ifr, int cmd);
處理特定于接口的 ioctl 命令. (這些命令的實現(xiàn)在"定制 ioclt 命令"一節(jié)中描述)相應的 net_device 結構中的成員可留為 NULL, 如果接口不需要任何特定于接口的命令.

void (set_multicast_list)(struct net_device dev);
當設備的組播列表改變和當標志改變時調用的方法. 詳情見"組播"一節(jié), 以及一個例子實現(xiàn).

int (set_mac_address)(struct net_device dev, void *addr);
如果接口支持改變它的硬件地址的能力, 可以實現(xiàn)這個函數(shù). 很多接口根本不支持這個能力. 其他的使用缺省的 eth_mac_adr 實現(xiàn)(在 deivers/net/net_init.c). eth_mac_addr 只拷貝新地址到 dev->dev_addr, 只在接口沒有運行時作這件事. 使用 eth_mac_addr 的驅動應當在它們的 open 方法中自 dev->dev_addr 里設置硬件 MAC 地址.

int (change_mtu)(struct net_device dev, int new_mtu);
當接口的最大傳輸單元 (MTU) 改變時動作的函數(shù). 如果用戶改變 MTU 時驅動需要做一些特殊的事情, 它應當聲明它的自己的函數(shù); 否則, 缺省的會將事情做對. snull 有對這個函數(shù)的一個模板, 如果你有興趣.

int (header_cache) (struct neighbour neigh, struct hh_cache *hh);
header_cache 被調用來填充 hh_cache 結構, 使用一個 ARP 請求的結果. 幾乎全部類似以太網(wǎng)的驅動可以使用缺省的 eth_header_cache 實現(xiàn).

int (header_cache_update) (struct hh_cache hh, struct net_device dev, unsigned char haddr);
在響應一個變化中, 更新 hh_cache 結構中的目的地址的方法. 以太網(wǎng)設備使用 eth_header_cache_update.

int (hard_header_parse) (struct sk_buff skb, unsigned char *haddr);
hard_header_parse 方法從包含在 skb 中的報文中抽取源地址, 拷貝到 haddr 的緩存區(qū). 函數(shù)的返回值是地址的長度. 以太網(wǎng)設備通常使用 eth_header_parse.

17.3.5.?公用成員

結構 net_device 剩下的數(shù)據(jù)成員由接口使用來持有有用的狀態(tài)信息. 有些是 ifconfig 和 netstat 用來提供給用戶關于當前配置的信息. 因此, 接口應當給這些成員賦值:

unsigned long trans_start;unsigned long last_rx;
保存一個 jiffy 值的成員. 驅動負責分別更新這些值, 當開始發(fā)送和收到一個報文時. trans_start 值被網(wǎng)絡子系統(tǒng)用來探測發(fā)送器加鎖. last_rx 目前沒有用到, 但是驅動應當盡量維護這個成員以備將來使用.

int watchdog_timeo;
網(wǎng)絡層認為一個傳送超時發(fā)生前應當過去的最小時間(按 jiffy 計算), 調用驅動的 tx_timeout 函數(shù).

void *priv;
filp->private_data 的對等者. 在現(xiàn)代的驅動里, 這個成員由 alloc_netdev 設置, 不應當直接存取; 使用 netdev_priv 代替.

struct dev_mc_list *mc_list;int mc_count;
處理組播發(fā)送的成員. mc_count 是 mc_list 中的項數(shù)目. 更多細節(jié)見"組播"一節(jié).

spinlock_t xmit_lock;int xmit_lock_owner;
xmit_lock 用來避免對驅動的 hard_start_xmit 函數(shù)多個同時調用. xmit_lock_owner 是已獲得 xmit_lock 的CPU號. 驅動應當不改變這些成員的值.

結構 net_device 中有其他的成員, 但是網(wǎng)絡驅動用不著它們.

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號