Linux系統下fd分配的方法

2024-06-28 13:24:26

字體：大中小

來源：轉載

供稿：網友

linux系統下fd分配的方法

最近幾天在公司里寫網絡通訊的代碼比較多，自然就會涉及到IO事件監測方法的問題。我驚奇的發現select輪訓的方法在那里居然還大行其道。我告訴他們現在無論在Linux系統下，還是windows系統下，select都應該被廢棄不用了，其原因是在兩個平臺上select的系統調用都有一個可以說是致命的坑。

在windows上面單個fd_set中容納的socket handle個數不能超過FD_SETSIZE(在win32 winsock2.h里其定義為64，以VS2010版本為準)，并且fd_set結構使用一個數組來容納這些socket handle的，每次FD_SET宏都是向這個數組中放入一個socket handle，并且此過程中是限定了不能超過FD_SETSIZE，具體請自己查看winsock2.h中FD_SET宏的定義。此處的問題是

若本身fd_set中的socket handle已經達到FD_SETSIZE個，那么后續的FD_SET操作實際上是沒有效果的，對應socket handle的IO事件將被遺漏?。。?/strong>而在Linux系統下面，該問題其實也是處在fd_set的結構和FD_SET宏上。此時fd_set結構是使用bit位序列來記錄每一個待檢測IO事件的fd。記錄的方式稍微復雜，如下

/usr/include/sys/select.h中

 1 typedef long int __fd_mask; 2 #define __NFDBITS    (8 * sizeof (__fd_mask)) 3 #define    __FDELT(d)    ((d) / __NFDBITS) 4  5 #define    __FDMASK(d)    ((__fd_mask) 1 << ((d) % __NFDBITS)) 6  7 typedef struct 8   { 9     /* XPG4.2 requires this member name.  Otherwise avoid the name10        from the global namespace.  */11 #ifdef __USE_XOPEN12     __fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];13 # define __FDS_BITS(set) ((set)->fds_bits)14 #else15     __fd_mask __fds_bits[__FD_SETSIZE / __NFDBITS];16 # define __FDS_BITS(set) ((set)->__fds_bits)17 #endif18   } fd_set;19 20 #define    FD_SET(fd, fdsetp)    __FD_SET (fd, fdsetp)

/usr/include/bits/select.h中

1 # define __FD_SET(d, set)    (__FDS_BITS (set)[__FDELT (d)] |= __FDMASK (d))

可以看出，在上面的過程，實際上每個bit在fd_set的bit序列中的位置對應于fd的值。而fd_set結構中bit位個數是__FD_SETSIZE定義的，__FD_SETSIZE在/usr/include/bits/typesize.h(包含關系如下sys/socket.h -> bits/types.h -> bits/typesizes.h)中被定義為1024。

現在的問題是，當fd>=1024時，FD_SET宏實際上會引起內存寫越界。而實際上在man select中對已也有明確的說明，如下

NOTES

An fd_set is a fixed size buffer. Executing FD_CLR() or FD_SET() with a value of fd that is negative or is equal to or larger than FD_SETSIZE will result in undefined behavior. Moreover, POSIX requires fd to be a valid file descriptor.

這一點包括之前的我，是很多人沒有注意到的，并且云風大神有篇博文《一起 select 引起的崩潰》也描述了這個問題。

可以看出在Linux系統select也是不安全的，若想使用，得小心翼翼的確認fd是否達到1024，但這很難做到，不然還是老老實實的用poll或epoll吧。

扯得有點遠了，但也引出了本片文章要敘述的主題，就是Linux系統下fd值是怎么分配確定，大家都知道fd是int類型，但其值是怎么增長的，在下面的內容中我對此進行了一點分析，以2.6.30版本的kernel為例，歡迎拍磚。

首先得知道是哪個函數進行fd分配，對此我以pipe為例，它是分配fd的一個典型的syscall，在fs/pipe.c中定義了pipe和pipe2的syscall實現，如下

 1 SYSCALL_DEFINE2(pipe2, int __user *, fildes, int, flags) 2 { 3     int fd[2]; 4     int error; 5  6     error = do_pipe_flags(fd, flags); 7     if (!error) { 8         if (copy_to_user(fildes, fd, sizeof(fd))) { 9             sys_close(fd[0]);10             sys_close(fd[1]);11             error = -EFAULT;12         }13     }14     return error;15 }16 17 SYSCALL_DEFINE1(pipe, int __user *, fildes)18 {19     return sys_pipe2(fildes, 0);20 }

進一步分析do_pipe_flags()實現，發現其使用get_unused_fd_flags(flags)來分配fd的，它是一個宏#define get_unused_fd_flags(flags) alloc_fd(0, (flags))，位于include/linux/fs.h中

好了咱們找到了主角了，就是alloc_fd()，它就是內核章實際執行fd分配的函數。其位于fs/file.c，實現也很簡單，如下

 1 int alloc_fd(unsigned start, unsigned flags) 2 { 3     struct files_struct *files = current->files; 4     unsigned int fd; 5     int error; 6     struct fdtable *fdt; 7  8     spin_lock(&files->file_lock); 9 repeat:10     fdt = files_fdtable(files);11     fd = start;12     if (fd < files->next_fd)13         fd = files->next_fd;14 15     if (fd < fdt->max_fds)16         fd = find_next_zero_bit(fdt->open_fds->fds_bits,17                        fdt->max_fds, fd);18 19     error = expand_files(files, fd);20     if (error < 0)21         goto out;22 23     /*24      * If we needed to expand the fs array we25      * might have blocked - try again.26      */27     if (error)28         goto repeat;29 30     if (start <= files->next_fd)31         files->next_fd = fd + 1;32 33     FD_SET(fd, fdt->open_fds);34     if (flags & O_CLOEXEC)35         FD_SET(fd, fdt->close_on_exec);36     else37         FD_CLR(fd, fdt->close_on_exec);38     error = fd;39 #if 140     /* Sanity check */41     if (rcu_dereference(fdt->fd[fd]) != NULL) {42         PRintk(KERN_WARNING "alloc_fd: slot %d not NULL!/n", fd);43         rcu_assign_pointer(fdt->fd[fd], NULL);44     }45 #endif46 47 out:48     spin_unlock(&files->file_lock);49     return error;50 }

在pipe的系統調用中start值始終為0，而中間比較關鍵的expand_files()函數是根據所給的fd值，判斷是否需要對進程的打開文件表進行擴容，其函數頭注釋如下

/* * Expand files. * This function will expand the file structures, if the requested size exceeds * the current capacity and there is room for expansion. * Return <0 error code on error; 0 when nothing done; 1 when files were * expanded and execution may have blocked. * The files->file_lock should be held on entry, and will be held on exit. */

此處對其實現就不做深究了，回到alloc_fd()，現在可以看出，其分配fd的原則是

每次優先分配fd值最小的空閑fd，當分配不成功，即返回EMFILE的錯誤碼，這表示當前進程中fd太多。

到此也印證了在公司寫的服務端程序(kernel是2.6.18)中，每次打印client鏈接對應的fd值得變化規律了，假如給一個新連接分配的fd值為8，那么其關閉之后，緊接著的新的鏈接分配到的fd也是8，再新的鏈接的fd值是逐漸加1的。

為此，我繼續找了一下socket對應fd分配方法，發現最終也是 alloc_fd(0, (flags)，調用序列如下socket(sys_call) -> sock_map_fd() -> sock_alloc_fd() -> get_unused_fd_flags()open系統調用也是用get_unused_fd_flags()，這里就不列舉了。

現在想回頭說說開篇的select的問題。由于Linux系統fd的分配規則，實際上是已經保證每次的fd值盡量的小，一般非IO頻繁的系統，的確一個進程中fd值達到1024的概率比較小。因而對此到底是否該棄用select，還不能完全地做絕對的結論。如果設計的系統的確有其他措施保證fd值小于1024，那么用select無可厚非。

但在網絡通訊程序這種場合是絕不應該作此假設的，所以還是盡量的不用select吧！！

上一篇：Linux網絡編程6&mdash;&mdash;使用TCP實現文件服務器

下一篇：Linux網絡編程4&mdash;&mdash;個人總結

發表評論 共有條評論

用戶名: 密碼:

驗證碼: 匿名發表

學習交流

更多

Intel工程樣品CPU的識別方法

圖解CMOS路線和硬盤光驅跳線的

硬盤分區如何設置準確的分區空間
硬盤分區如何設置準確的分區空間...

HTC M8怎么換主題 M8換主題方法12-23

錘子手機如何開啟單手撥號面板12-23

OPPO R7拍照音如何關閉12-23

LG G3如何開啟來電翻轉靜音12-23

網站后臺系統設置的網站地址格式寫法07-09

防止重復提交js按鈕變灰07-09

不同時間顯示不同的廣告代碼07-09

iframe框架調用高度自適應方法07-09

備份數據庫出現問題的解決方法07-09

熱門圖片

更多

回眸一笑百魅生，六宮粉黛無顏色

歲月靜美，剪一影煙雨江南

蕪湖有個“松鼠小鎮”

小滿：小得盈滿，一切剛剛好！

一串串晶瑩剔透的葡萄，像一顆顆寶石掛在藤

正宗老北京脆皮烤鴨

人逢知己千杯少，喝酒搞笑圖集

搞笑試卷，學生惡搞答題

猜你喜歡的新聞

最牛同桌！我考了696分我同桌考了703分

650分！高二女生考入北大：遺憾不能上高三

男生估分600只考了397 媽媽：高考雖重要，但不

唐尚珺回應是否會直播帶貨：有人出100萬想和

名校搶人名場面：清華、北大太拼了！

男生高考語文滿分！網友：第一次聽說

第16次參加高考！唐尚珺今年成績超600分

語文145分學霸筆記公開字跡清秀：多閱讀，該背

數學滿分！四川綿陽一男生高考710分理綜僅扣

阿里全球數學競賽選手：決賽專業性太強，6道題

猜你喜歡的關注

在Linux上解決用Swing出現中文方塊問題

Linux下JBoss不能顯示JasperReport報表

實用技巧：SUSE Linux系統下VNC遠程控制

Ubuntu Linux操作系統安裝配置Samba服務

Ubuntu Linux系統啟動速度慢的問題解決

Linux操作系統下生成引導盤與驅動程序盤

Ubuntu Linux 8.04操作系統4月24日發布

Linux技巧：清除代理服務器上cache記錄

VMware虛擬機Linux系統用戶數據存放技巧

騰訊QQ首次表態官方支持Linux操作系統

新聞熱點

最牛同桌！我考了696分我同桌考了703分

2024-06-26 22:28:41

650分！高二女生考入北大：遺憾不能上高三

2024-06-26 22:26:16

男生估分600只考了397 媽媽：高考雖重要，但不代表所有

2024-06-26 22:23:01

唐尚珺回應是否會直播帶貨：有人出100萬想和他合作！

2024-06-25 19:29:23

名校搶人名場面：清華、北大太拼了！

2024-06-25 19:22:14

男生高考語文滿分！網友：第一次聽說

2024-06-25 19:19:15

疑難解答

硬盤分區如何設置準確的分區空間

Intel工程樣品CPU的識別方法

圖解CMOS路線和硬盤光驅跳線的設置

屏蔽集成顯卡和網卡的方法

帶Raid功能的主板芯片組全掃描

U盤提示“U盤的I/O接口故障”的修復方

映泰主板設置鼠標開機的方法

如何更換電腦主板上的電池

顯示器在最后一步進不去系統的解決方

開機一切正常而顯示器無顯示的故障

圖片精選

Linux系統中網絡配置詳解

Linux操作系統中安裝和試用IE、Off

漂亮的國產Linux操作系統Open Desk

組網不求人！搭建簡易Linux局網服務

網友關注

小米4放大手勢怎么關閉

HTC M8怎么換主題 M8換主題方法

錘子手機如何開啟單手撥號面板

OPPO R7拍照音如何關閉

LG G3如何開啟來電翻轉靜音

小米Note頂配版怎么設置默認撥號卡

HTC M8媒體手勢如何關閉

三星S6Edge超級省電模式開啟方法

華為P8青春版如何屏蔽鎖屏下拉通知欄

努比亞Z9怎么裝SIM卡 Z9插手機卡方法

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

Linux系統下fd分配的方法