Linux下的的轻量级HTTP服务器实现

小型HTTP服务器

读了很多 Linux 下小型的 http 服务器,还是觉得来自朱家顺的Zaver比较适合新手学习

Zaver,一个结构简单,支持高并发的http服务器。基本架构是事件循环 + non-blocking I/O + 线程池。Zaver的代码风格参考了Nginx的风格,所以在可读性上非常高。另外,Zaver提供了配置文件和命令行参数解析,以及完善的Makefile和源代码结构,也可以帮助任何一个C初学者入门一个项目是怎么构建的。

需要改进的地方

  • 只支持静态页面
  • HTTP1.1支持不完全,目前只实现了几个主要的(keep-alive, browser cache)的header解析
  • 没有内存池
  • 没有缓存
  • 没有日志
  • 没有用session建立对话
  • 无活动连接的超时过期还没有做
  • 后台运行用的是 while死循环 而不是 daemon process

代码实现

epoll

使用一个文件描述符管理多个描述符,把事件都放入一个时间表中

  • int epoll_create();
  • int epoll_ctl();
  • int epoll_wait();

如果一个fd没有被它的工作线程读完,所以依然会被认为是可读的,如果下次事件循环又返回这个fd,又会分给别的线程。
所以要将默认的LT(level trigger)水平触发改为ET(edge trigger)边缘触发模式

更多关于select poll epoll的学习可以看这个大神的博客


debug

自定义调试信息的输出

调试信息的输出方法有很多种, 例如直接用printf, 或者出错时使用perror, fprintf等将信息直接打印到终端上, 在Qt上面一般使用qDebug,而守护进程则一般是使用syslog将调试信息输出到日志文件中等等…

使用标准的方法打印调试信息有时候不是很方便, 例如Qt编程, 在调试已有的代码时, 我想在打印调试信息的地方, 把代码位置也打印出来以方便定位错误, 或者需要在调试信息前面加一个前辍, 好方便在调试信息太多的时候可以用grep过滤一下, 仅显示本模块的调试信息, 这时就需要一个一个地修改已有的qDebug, 使其成为以下形式:
  
qDebug( “[模块名称] 调试信息 File:%s, Line:%d”, FILE, LINE );
  
这样的修改比较烦人, 而且一不小心会遗漏某个没改的…
为了能方便地管理调试信息的输出,一个比较简单的方法就是自已定义一个打印调试信息的宏, 然后替换原来的,废话就不多说了,直接给出一个现成的,下面是一个例子, 我用WiFi表示当前代码的模块名称,我要求在模块中的所有调试信息前面均带有[WiFi]前辍,这样我就能方便地只需使用命令行 | grep “[WiFi]“来过滤掉来自其它模块的调试信息了:

#define qWiFiDebug(format, …) qDebug(“[WiFi] “format” File:%s, Line:%d, Function:%s”, ##VA_ARGS, FILE, LINE , FUNCTION);
  
上面的宏是使用qDebug输出调试信息,在非Qt的程序中也可以改为printf,守护进程则可以改为syslog等等… 其中,决窍其实就是这几个宏 ##VA_ARGS, FILE, LINEFUNCTION,下面介绍一下这几个宏:
  1) VA_ARGS 是一个可变参数的宏,很少人知道这个宏,这个可变参数的宏是新的C99规范中新增的,目前似乎只有gcc支持(VC6.0的编译器不支持)。宏前面加上##的作用在于,当可变参数的个数为0时,这里的##起到把前面多余的”,”去掉的作用,否则会编译出错, 你可以试试。
  2) FILE 宏在预编译时会替换成当前的源文件名
  3) LINE宏在预编译时会替换成当前的行号
  4) FUNCTION宏在预编译时会替换成当前的函数名称
  有了以上这几个宏,特别是有了VA_ARGS ,调试信息的输出就变得灵活多了。


threadpool

用C++来实现线程池,之前也写过这个大神的C++的线程池demo,分别用C++98、C++03、C++11实现了一遍,体会到C++11的方便了啊

因为项目是C语言的,所以必须用到 extern关键字 来混入C++代码,这也是面试常考的内容

具体的看这篇博文C/C++中extern关键字详解

线程池主要含有三个队列

  • 工作队列
  • 工作线程队列
  • 忙碌线程队列

timer

Nginxrbtree 实现timer

但是为了简单化,我们用 libevent2-heap 二叉最小堆来实现

淘宝的 Tengine4-heap 四叉最小堆实现 timer ,四叉最小堆是二叉最小堆的变种,比其有更浅的深度和更好的 CPU Cache 命中率

http

1.method

nginx在判断http method的时候用的不是字符串比较,而是整数比较。
比如“POST”,一般的写法是用strcmp,就会牵扯到4次char的比较。
而nginx把接受到的method转化为一个int,那么4次比较就可以转化为1次比较。

具体代码如下:

1
2
#define ngx_str3Ocmp(m, c0, c1, c2, c3) \
*(uint32_t *) m == ((c3 << 24) | (c2 << 16) | (c1 << 8) | c0)

2.request

3.parse

目前只实现了几个主要的(keep-alive, browser cache)的header解析

4.connection

这一部分的实现放在了utils里面

utility各种通用函数

这里主要是connect的函数

话说C的模块化真是一门技术活,全靠文件。。。

main函数

搭建成功

项目地址