导读 | linux 开发应该多少都听过大名鼎鼎的 list.h ,其简洁优雅的设计,一个头文件完成了一个高可用的链表。 |
linux 开发应该多少都听过大名鼎鼎的 list.h ,其简洁优雅的设计,一个头文件完成了一个高可用的链表。
但是 list.h 并不是线程安全的,在多线程的情况下使用,必须考虑多线程数据同步的问题。
然而。。。。
我在使用互斥锁对链表的操作进行保护之后,还是被坑了!
下面是把我坑了的 list_for_each_entry 和 list_for_each_entry_safe 两个函数的详细分析。
在 list.h 这个文件中有非常多值得学习的地方,比如其最经典的 container_of 的实现。
在这里只介绍几个常用的函数,然后重点分析在多线程使用时的碰到的坑。
首先定义一个链表和链表节点,定义一个产品,其属性为产品重量(weight)。
typedef struct product_s { struct list_head product_node; uint32_t index; uint32_t weight; }product_t; //初始化链表头 LIST_HEAD(product_list);
生产者在生产完产品后,将产品加入链表,等待消费者使用。
void producer(void) { product_t *product = malloc(sizeof(product_t)); // 产品重量为 300 ± 10 product->weight = 290 + rand() % 20; printf("product :%p, weight %d\n", product, product->weight); list_add_tail(&product->product_node, &product_list); }
使用 list_for_each_entry 可以将链表进行遍历:
// 遍历打印链表信息 void print_produce_list(void) { product_t *product; list_for_each_entry(product, &product_list, product_node) { printf("manufacture product :%p, weight %d\n", product, product->weight); } }
其具体实现是使用宏将 for 循环的初始条件和完成条件进行了替换:
#define list_for_each_entry(pos, head, member) \ for (pos = list_first_entry(head, typeof(*pos), member); \ &pos->member != (head); \ pos = list_next_entry(pos, member))
其中for循环的第一个参数将 pos = list_first_entry(head, typeof(*pos), member); 初始化为链表头指向的第一个实体链表成员。
第二个参数 &pos->member != (head) 为跳出条件,当pos->member再次指向链表头时跳出for循环。
for的第三个参数通过pos->member.next指针遍历整个实体链表,当pos->member.next再次指向我们的链表头的时候跳出for循环。
但是 list_for_each_entry 不能在遍历的循环体中删除节点,因为在循环体中删除链表节点后,当前节点的前驱结点和后继结点指针会被置空。
在for循环的第三个参数中,获取下一个节点时,会发生非法指针访问
为了解决在遍历链表过程中,无法删除结点的问题,在 list.h 中提供了一个安全删除节点的函数
// 删除重量小于300的节点 void remove_unqualified_produce(void) { product_t *product, *temp; list_for_each_entry_safe(product, temp, &product_list, product_node) { // 移除重量小于300的产品 if (product->weight < 300) { printf("remove product :%p, weight %d\n", product, product->weight); list_del(&product->product_node); free(product); } } }
其实现是使用一个中间变量,在开始每次开始执行循环体前,将当前节点的下一个节点保存到中间变量,从而实现"安全"遍历
#define list_for_each_entry_safe(pos, n, head, member) \ for (pos = list_first_entry(head, typeof(*pos), member), \ n = list_next_entry(pos, member); \ &pos->member != (head); \ pos = n, n = list_next_entry(n, member))
上面我们在主线程里面创建了产品,并放入到链表中并,并过滤了重量小于300的产品。
后面我们在多线程中对产品进行消费(两个线程同时消费链表的数据,使用完成后删除并释放结点)。
这里的逻辑和单线程中的差不多,同样是遍历链表,然后从链表中删除节点。不同的是,由于list.h自身没有带锁,所以需要使用互斥锁将链表的操作进行保护。
于是很自然的有了下面的代码
void * consumer(void *arg) { product_t *product, *temp; // 使用互斥锁对链表进行保护 pthread_mutex_lock(&producer_mutex); list_for_each_entry_safe(product, temp, &product_list, product_node) { list_del(&product->product_node); printf("consume product :%p, weight %d, consumer :%p\n", product, product->weight, (void *)pthread_self()); pthread_mutex_unlock(&producer_mutex); // 睡一会,防止太快了 usleep(10*1000); free(product); pthread_mutex_lock(&producer_mutex); } pthread_mutex_unlock(&producer_mutex); return NULL; }
在上面的这段代码中,在对链表操作时,使用互斥锁对链表进行了保护,使同时只能有一个线程访问链表。
不过你以为这样就好了嘛,如果时这样,这篇文章就没存在的必要了。。。
在两个线程同时遍历时,即便是加了锁之后,数据访问也不安全。
在遍历使用的 list_for_each_entry_safe 宏中,使用了一个零时变量对保存着当前链表的下一个节点。
但是多线程访问链表时,有可能零时变量保存的节点,被另一个线程删除了,所以访问的时候又是 Segmentation fault
原因找到了,也就好办了。以至于解决方法嘛,我是使用一个全局的零时变量,将需要删除节点的下一个节点保存起来,手动实现多线程的"安全删除"。
// 消费者 void * consumer(void *arg) { product_t *product; // 使用互斥锁对链表进行保护 pthread_mutex_lock(&producer_mutex); list_for_each_entry(product, &product_list, product_node) { temp = list_next_entry(product, product_node); list_del(&product->product_node); printf("consume product :%p, weight %d, consumer :%p\n", product, product->weight, (void *)pthread_self()); pthread_mutex_unlock(&producer_mutex); // 睡一会,防止太快 usleep(10*1000); free(product); pthread_mutex_lock(&producer_mutex); if(temp != NULL){ product = list_prev_entry(temp, product_node); } } pthread_mutex_unlock(&producer_mutex); return NULL; }
一个晚上找到了这个bug,然后又花了一个晚上记录下来这个bug。
据说 klist.h 是 list.h 的线程安全版本,后面花时间在研究一下去,今天就先睡了。。。
原文来自:
本文地址://q13zd.cn/secrity-moutl-list-h.html编辑:问题终结者,审核员:逄增宝
Linux大全:
Linux系统大全: