本文所实现的服务器仅仅是演示和理解原理所用,力求简单易懂。
要是现实一个 web 服务器,那么就需要了解 web 服务器的运行原理。
先从静态的文本服务器开始,以访问 web 服务器的1.html
为例
1.客户端通过发送一个 http 请求到服务器,如果服务器监听的端口号是9002,那么在本机自身测试访问的地址就是http://localhost:9002/1.html。
2.服务器监听着9002端口,那么在收到请求了请求之后,就能从 http head 头中获取到请求里需要访问的 uri 资源在web 目录中的位置。
3.服务器读取需要访问的资源文件,然后填充到 http 的实体中返回给客户端。
示意图如下:
由于博客贴太多代码不太方便,静态服务器演示代码,我已经上传 github https://github.com/zhoumengkang/php/tree/master/php-webserver/static
下图为我访问我 web 目录下的1.jpg
文件的截图
简单的静态 web 服务器已经完成了,下面的问题就是怎么让其支持动态内容的输出了。
是不是只需要在 web 服务器内部执行完某个程序之后,把得到的结果返回给客户端就行呢?但是这样 web 服务器的代码就和业务代码耦合在一起了,怎么解决一个 web 服务器,可以运用在各个业务场景下呢?CGI
的出现解决了这一问题。那么 CGI 是什么呢?下面这段话复制的:
CGI是外部应用程序(CGI程序)与Web服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的规程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器,CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
好晕,举个具体的例子,比如我们在使用的 PHP 的全局变量$_SERVER['QUERY_STRING']
就是 Web 服务器通过 CGI 协议之上,传递过来的。例如在 Nginx 中,也许你记得这样的 fastcgi 配置
fastcgi_param QUERY_STRING $query_string;
没错 nginx 把自己的全局变量$query_string
传递给了fastcgi_param
的环境变量中。
下面我们也以 CGI 的QUERY_STRING
作为桥梁,将客户端请求的 uri 中的信息传递到 cgi 程序中去。通过putenv
的方式把QUERY_STRING
存入该请求的环境变量中。
我们约定 Web 服务器中访问的资源是.cgi
后缀则表示是动态访问,这一点有点儿类似于 nginx 里配置 location 来寻找 php 脚本程序一样。都是一种检查是否应该请求 cgi 程序的规则。为了和 Web 服务器区别开来,我用 C 写了一个查询用户信息的 cgi 程序,根据用户 id 查询用户资料。
演示代码地址:https://github.com/zhoumengkang/php/tree/master/php-webserver/dynamic
如果要运行该 demo 需要做如下操作
1.修改config.php
里的项目根目录WEB_ROOT
2.编译cgi-demo\user.c
,编译命令gcc -o user.cgi user.c
,然后将user.cgi
文件放入你配置的项目根目录下面
3.在终端执行php start.php
,这样该 web 服务器就启动了
4.通过 http://localhost:9003/user.cgi?id=1 就可以访问看到如下效果了
关于并发的支持,不是本文的讨论范围,有兴趣的可以看我的系列笔记 http://mengkang.net/567.html