小型HTTP服务器
读了很多 Linux 下小型的 http 服务器,还是觉得来自朱家顺的Zaver比较适合新手学习
Zaver,一个结构简单,支持高并发的http服务器。基本架构是事件循环 + non-blocking I/O + 线程池。Zaver的代码风格参考了Nginx的风格,所以在可读性上非常高。另外,Zaver提供了配置文件和命令行参数解析,以及完善的Makefile和源代码结构,也可以帮助任何一个C初学者入门一个项目是怎么构建的。
需要改进的地方
- 只支持静态页面
- HTTP1.1支持不完全,目前只实现了几个主要的(keep-alive, browser cache)的header解析
- 没有内存池
- 没有缓存
- 没有日志
- 没有用session建立对话
- 无活动连接的超时过期还没有做
- 后台运行用的是 while死循环 而不是 daemon process
代码实现
epoll
使用一个文件描述符管理多个描述符,把事件都放入一个时间表中
- int epoll_create();
- int epoll_ctl();
- int epoll_wait();
如果一个fd没有被它的工作线程读完,所以依然会被认为是可读的,如果下次事件循环又返回这个fd,又会分给别的线程。
所以要将默认的LT(level trigger)水平触发改为ET(edge trigger)边缘触发模式
更多关于select poll epoll的学习可以看这个大神的博客
debug
自定义调试信息的输出
调试信息的输出方法有很多种, 例如直接用printf, 或者出错时使用perror, fprintf等将信息直接打印到终端上, 在Qt上面一般使用qDebug,而守护进程则一般是使用syslog将调试信息输出到日志文件中等等…
使用标准的方法打印调试信息有时候不是很方便, 例如Qt编程, 在调试已有的代码时, 我想在打印调试信息的地方, 把代码位置也打印出来以方便定位错误, 或者需要在调试信息前面加一个前辍, 好方便在调试信息太多的时候可以用grep过滤一下, 仅显示本模块的调试信息, 这时就需要一个一个地修改已有的qDebug, 使其成为以下形式:
qDebug( “[模块名称] 调试信息 File:%s, Line:%d”, FILE, LINE );
这样的修改比较烦人, 而且一不小心会遗漏某个没改的…
为了能方便地管理调试信息的输出,一个比较简单的方法就是自已定义一个打印调试信息的宏, 然后替换原来的,废话就不多说了,直接给出一个现成的,下面是一个例子, 我用WiFi表示当前代码的模块名称,我要求在模块中的所有调试信息前面均带有[WiFi]前辍,这样我就能方便地只需使用命令行 | grep “[WiFi]“来过滤掉来自其它模块的调试信息了:#define qWiFiDebug(format, …) qDebug(“[WiFi] “format” File:%s, Line:%d, Function:%s”, ##VA_ARGS, FILE, LINE , FUNCTION);
上面的宏是使用qDebug输出调试信息,在非Qt的程序中也可以改为printf,守护进程则可以改为syslog等等… 其中,决窍其实就是这几个宏 ##VA_ARGS, FILE, LINE 和FUNCTION,下面介绍一下这几个宏:
1) VA_ARGS 是一个可变参数的宏,很少人知道这个宏,这个可变参数的宏是新的C99规范中新增的,目前似乎只有gcc支持(VC6.0的编译器不支持)。宏前面加上##的作用在于,当可变参数的个数为0时,这里的##起到把前面多余的”,”去掉的作用,否则会编译出错, 你可以试试。
2) FILE 宏在预编译时会替换成当前的源文件名
3) LINE宏在预编译时会替换成当前的行号
4) FUNCTION宏在预编译时会替换成当前的函数名称
有了以上这几个宏,特别是有了VA_ARGS ,调试信息的输出就变得灵活多了。
threadpool
用C++来实现线程池,之前也写过这个大神的C++的线程池demo,分别用C++98、C++03、C++11实现了一遍,体会到C++11的方便了啊
因为项目是C语言的,所以必须用到 extern关键字 来混入C++代码,这也是面试常考的内容
具体的看这篇博文C/C++中extern关键字详解
线程池主要含有三个队列
- 工作队列
- 工作线程队列
- 忙碌线程队列
timer
Nginx 用 rbtree 实现timer
但是为了简单化,我们用 libevent 的 2-heap 二叉最小堆来实现
淘宝的 Tengine 用 4-heap 四叉最小堆实现 timer ,四叉最小堆是二叉最小堆的变种,比其有更浅的深度和更好的 CPU Cache 命中率
http
1.method
nginx在判断http method的时候用的不是字符串比较,而是整数比较。
比如“POST”,一般的写法是用strcmp,就会牵扯到4次char的比较。
而nginx把接受到的method转化为一个int,那么4次比较就可以转化为1次比较。
具体代码如下:
|
|
2.request
- 参考Nginx,用priority queue来存储header
- 关于__GNU_SOURCE这个宏
- 关于epoll的小细节
3.parse
目前只实现了几个主要的(keep-alive, browser cache)的header解析
4.connection
这一部分的实现放在了utils里面
utility各种通用函数
这里主要是connect的函数
话说C的模块化真是一门技术活,全靠文件。。。