2.2.1 反向代理
- 代理是什么?
-
- 简单来说,我找一个中间人,代替我去做一件事情,只要他给我结果就可以。
-
- 代理一般分为两种:正向代理、反向代理
-
正向代理&*反向代理
区别
- 从用途上来讲:
-
- 正向代理-为局域网客户端向外访问Internet服务。可以使用缓冲特性减少网络使用率。
-
- 反向代理-为局域网服务器向外提供Internet服务。可以使用负载平衡提高客户访问量。还可以基于高级URL策略和管理技术对服务进行高质量管控。
-
从安全性来讲:
- 正向代理-必须采取安全措施确保内网客户端通过它访问外部网站。隐藏客户端的身份[A1]
-
- 反向代理-对外提供服务是透明的,客户端并不知道自己访问的是一个代理。隐藏服务端的身份[A2]
-
nginx 代理模块
官方介绍
- 官方资料:http://www.nginx.cn/doc/standard/httpproxy.html
-
- 官方的代理属性很多,我们主要介绍proxy_pass和proxy_set_header属性
-
官方代码示例
- location / {
-
- : proxy_pass http://localhost:8000; # 设定请求跳转后的地址,可以使用hostname或IP:Port形式
-
- : proxy_set_header X-Real-IP $remote_addr; # 后端请求携带原始请求的真实IP地址
-
- }
-
属性详解:
- proxy_pass 指令设置被代理服务器的地址和被映射的URI,地址可以使用主机名或IP加端口号的形式
-
proxy_pass关键点
- proxy_pass后面的路径最后的/作用很重要!!!
-
- 示例代码:
-
- location /html/ {
-
- 1 proxy_pass http://proxy.com;
-
- 2 proxy_pass http://proxy.com/;
-
- }
-
- 假设我们访问的url是 http://domain.com/html/test.js,如何理解上述两种proxy_pass的区别呢?
-
- 对于 1 来说 proxy.com后面没有"/",表示"/html/" 请求(包括自己)后续的路径及其参数等关键字都由http://a.com/来处理,代理后的样式如下:
-
- http://proxy.com/html/test.js
-
- 对于 2 来所 proxy.com后面有"/",表示"/html/" 请求后续的路径及其参数等关键字都由http://a.com/来处理,代理后的样式如下:
-
- http://proxy.com/test.js
-
nginx代理实践
- 代理的配置文件
-
- ~# vim/etc/nginx/conf.d/proxy.conf
-
- server {
-
- listen 192.168.8.14:80;
-
- server_name www.sswang.com;
-
- location / {
-
- proxy_pass http://192.168.8.14:9999/hello/;
-
- }
-
- }
-
后端服务配置文件
- ~# vim/etc/nginx/conf.d/hello.conf
-
- server {
-
- listen 192.168.8.14:9999;
-
- location /hello/ {
-
- alias /var/www/html/hello/;
-
- try_files uri uri/ =404;
-
- }
-
- }
-
准备后端服务文件
- mkdir -p /var/www/html/hello/
-
- echo'<h1>proxy_backend</h1>' > /var/www/html/hello/index.html
-
检查nginx配置后重载服务
- /usr/sbin/nginx -t
-
- systemctl reload nginx
-
- netstat -tnulp | grep nginx
-
- 查看效果
-
2.2.2 负载均衡
- 负载均衡是什么?
-
- 我们之前使用proxy_pass的方式实现了nginx代理请求到后端的效果,随着我们的网站访问量越来越多,一个后端就不现实了,那么接下来我们应该如果在访问量日渐增大的情况下,满足线上业务的稳定呢?
-
- 解决方法就是:负载均衡
-
- 负载均衡简单说来人多力量大,打群架。
-
- 在nginx中的负载均衡主要有两种:四层负载(IP:Port)、七层负载(http://xxx)
-
nginx upstream模块
官方介绍
- 官方资料:http://www.nginx.cn/doc/standard/httpupstream.html
-
- 官方的代理属性很多,我们主要介绍upstream和ip_hash属性
-
- 官方代码示例
-
- upstream backend {
-
- serverbackend1.example.com weight=5;
-
- server backend2.example.com:8080;
-
- server unix:/tmp/backend3;
-
- }
-
-
-
- server {
-
- location / {
-
- proxy_pass http://backend;
-
- }
-
- }
-
属性详解:
- upstream 主要是定义一个后端服务地址的集合列表,每个后端服务使用一个server命令表示
-
- upstream {} 和 Server {} 两部分内容属于平级关系。
-
后端服务状态
- 在upstream模块中,可以使用server命令指定后端服务器的地址,同时还可以设置后端服务器在负载均衡调度中的状态,常用的状态有以下几种:
-
- down: 表示当前server主机暂时不参与负载均衡。
-
- backup:后备主机,当所有非backup机器出现故障或者繁忙的时候,才会请求backup机器。
-
- max_fails:允许请求的最大失败数,默认为1,配合fail_timeout一起使用
-
- fail_timeout:经历max_fails次失败后,暂停服务的时间,默认为10s。
-
nginx负载均衡实践
负载均衡配置文件
- ~# vim/etc/nginx/conf.d/upstream.conf
-
- upstream backends {
-
- server 192.168.8.14:10086;
-
- server 192.168.8.14:10087;
-
- server 192.168.8.14:10088;
-
- }
-
- server {
-
- listen 80;
-
- server_name localhost;
-
- location / {
-
- proxy_pass http://backends;
-
- }
-
- }
-
后端代理配置文件
- ~# vim/etc/nginx/conf.d/backend.conf
-
- server {
-
- listen 192.168.8.14:10086;
-
- location / {
-
- root /var/www/html/hello/;
-
- try_files uri uri/ =404;
-
- }
-
- }
-
- server {
-
- listen 192.168.8.14:10087;
-
- location / {
-
- root /var/www/html/nihao/;
-
- try_files uri uri/ =404;
-
- }
-
- }
-
- server {
-
- listen 192.168.8.14:10088;
-
- location / {
-
- root /var/www/html/huanying/;
-
- try_files uri uri/ =404;
-
- }
-
- }
-
准备后端服务文件
- mkdir -p /var/www/html/hello/
-
- echo '<h1>backend_hello</h1>'> /var/www/html/hello/index.html
-
- mkdir -p /var/www/html/nihao/
-
- echo'<h1>backend_nihao</h1>' > /var/www/html/nihao/index.html
-
- mkdir -p /var/www/html/huanying/
-
- echo'<h1>backend_huanying</h1>' > /var/www/html/huanying/index.html
-
- 检查nginx配置后重载服务
-
- /usr/sbin/nginx -t
-
- systemctl reload nginx
-
- netstat -tnulp | grep nginx
-
注意:
- 因为课堂演示配置文件过多,而且重载次数过多,所以推荐每次进行新实践的时候,pkill nginx后再来启动,使用新的内存环境。
-
查看效果
- ~# for i in {1..100};do curlhttp://192.168.8.14;done
-
- <h1>backend_hello</h1>
-
- <h1>backend_nihao</h1>
-
- <h1>backend_huanying</h1>
-
- ...
-
- <h1>backend_hello</h1>
-
- <h1>backend_nihao</h1>
-
- <h1>backend_huanying</h1>
-
负载均衡调度算法
- 官方资料:http://nginx.org/en/docs/http/ngx_http_upstream_module.html#example
-
Nginx提供的负载均衡策略有两种:
- 内置策略:nginx自带的算法
-
- 雨露均沾型:轮训、加权轮训、哈希
-
- 定向服务型:ip_hash、least_conn、cookie、route、lean、
-
- 商业类型:ntlm、least_time、queue、stick
-
- 扩展策略:各种结合业务场景自定义的算法或者第三方算法
-
自定义算法
- 第三方算法:fair、url_hash
-
常用算法简介:
- 轮询(默认):请求按顺序逐一分配到不同的后端服务器。
-
- weight:指定轮询权重,值越大,分配到的几率就越高,适用于后端服务器性能不均衡情况。
-
- ip_hash:按访问IP的哈希结果分配请求,分配后访客访问固定后端服务器,有效的解决动态网页会话共享问题。
-
- fair:基于后端服务器的响应时间来分配请求,响应时间短的优先分配。
-
- url_hash:按访问URL的哈希结果分配请求,使同URL定向到同一台后端服务器,可提高后端缓存服务器的效率。
-
加权轮训实践
- 修改负载均衡配置文件
-
- ~# vim/etc/nginx/conf.d/upstream.conf
-
- upstream backends {
-
- server 192.168.8.14:10086 backup;
-
- server 192.168.8.14:10087 weight=1;
-
- server 192.168.8.14:10088 weight=2;
-
- }
-
- ...
-
检查nginx配置后重载服务
- /usr/sbin/nginx -t
-
- systemctl reload nginx
-
- netstat -tnulp | grep nginx
-
查看效果
- ~# for i in {1..100};do curlhttp://192.168.8.14;done
-
- <h1>backend_nihao</h1>
-
- <h1>backend_huanying</h1>
-
- <h1>backend_huanying</h1>
-
- ...
-
- <h1>backend_nihao</h1>
-
- <h1>backend_huanying</h1>
-
- <h1>backend_huanying</h1>
-
ip_hash实践
修改负载均衡配置文件
- ~# vim/etc/nginx/conf.d/upstream.conf
-
- upstream backends {
-
- ip_hash;
-
- server 192.168.8.14:10086 ;
-
- ...
-
- }
-
- ...
-
检查nginx配置后重载服务
- /usr/sbin/nginx -t
-
- systemctl reload nginx
-
- netstat -tnulp | grep nginx
-
查看效果
- ~# for i in {1..100};do curlhttp://192.168.8.14;done
-
- <h1>backend_huanying</h1>
-
- ...
-
- <h1>backend_huanying</h1>
-
2.2.3 日志解析
日志功能简介
- 日志简介
-
- Nginx默认提供了两个日志文件 access.log和error.log,通过access.log可以得到用户请求的相关信息;通 过error.log可以获取某个web服务故障或其性能瓶颈等信息。
-
- 而且nginx的日志支持定制化格式,这样我们就可以根据实际的业务情况更好的高效工作。最常见的场景就是获取客户端的IP,记录用户访问量。
-
- 官方介绍:http://nginx.org/en/docs/http/ngx_http_log_module.html
-
基本配置
- # cat /etc/nginx/nginx.conf -n
-
- 40 access_log/var/log/nginx/access.log;
-
- 41 error_log/var/log/nginx/error.log;
-
注意:
- nginx日志属性设置的完整格式是:
-
- 属性名称 access_log
-
- 存储位置/var/log/nginx/access.log
-
- 日志格式 位置为空表示使用默认的combined 日志格式。它是通过log_format设置的
-
默认日志格式
- log_format combined 'remote_addr- remote_user [$time_local] '
-
- '"request"status $body_bytes_sent '
-
- '"http_referer""http_user_agent"';
-
注意:
- log_format是有一批nginx内置变量组合而成的。
-
日志样式:
- # tail /var/log/nginx/access.log
-
- 192.168.8.14 - -[12/Nov/2018:08:24:18 -0800] "GET /favicon.ico HTTP/1.0" 404 580"-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"
-
nginx常用内置变量
- nginx常用的内置变量主要是用来分析日志中的http记录的,我们可以根据内置的变量精确的获取相关的信息
-
默认变量
- $remote_addr 前一台主机的ip地址,不一定是真实的客户端IP
-
- $remote_user 用于记录远程客户端的用户名称(一般为“-”)
-
- $time_local 用于记录访问时间和时区
-
- $request 用于记录请求的url以及请求方法
-
- $status 响应状态码,例如:200成功、404页面找不到等。
-
- $body_bytes_sent 给客户端发送的文件主体内容字节数
-
- $http_referer 可以记录用户是从哪个链接访问过来的
-
- $http_user_agent 用户所使用的代理(一般为浏览器)
-
其他常用变量
- $request_uri 包含请求参数的原始URI,不包含主机名
-
- $uri 不带请求参数的当前URI,不包含主机名
-
- $http_x_forwarded_for 可以记录客户端IP,通过代理服务器来记录客户端的ip地址
-
- $http_x_real_ip 可以记录客户端IP,通过代理服务器来记录客户端的ip地址
-
- args 这个变量等于请求行中的参数,同query_string
-
- $host 请求主机头字段,否则为服务器名称。
-
- $scheme HTTP方法(如http,https)
-
- document_uri 与uri相同
-
- $document_root 当前请求文件配置文件中html的根目录即root值
-
- $request_filename 当前请求的文件路径,由root或alias指令与URI请求生成
-
示例:
- 例:http://localhost:10086/sswang1/sswang2/test.txt
-
- $host localhost
-
- $server_port 10086
-
- $request_uri /sswang1/sswang2/test.txt
-
- $document_uri /sswang1/sswang2/test.txt
-
- $document_root /var/www/html
-
- $request_filename /var/www/html/sswang1/sswang2/test.txt
-
自定义日志实践
需求:
- 基于代理方式访问app1应用,日志存放在/var/logs/nginx/app1/access.log,要求能从日志中获取客户端的IP地址
-
- 因为是获取代理前面客户端的真实IP,需要nginx开启 --with-http_realip_module 功能,使用nginx -V来检查,ubuntu默认安装的已经开启了该功能。
-
设置日志格式
- ~# vim /etc/nginx/nginx.conf
-
- #Logging Settings
-
- ## 设定日志格式的方法: log_format 格式名称 "日志表现样式"
-
- log_format proxy_format 'remote_addr -remote_user [$time_local] '
-
- '"request"status body_bytes_sent "http_referer"'
-
- '"http_user_agent" "http_x_real_ip""$http_x_forwarded_for"';
-
使用日志格式:
- access_log 日志路径 格式名称;
-
负载均衡配置文件
- ~# vim/etc/nginx/conf.d/upstream.conf
-
- upstream backends {
-
- server 192.168.8.14:10086;
-
- }
-
- server {
-
- listen 80;
-
- server_name localhost;
-
- location / {
-
- proxy_pass http://backends;
-
- proxy_set_header X-Real-IP $remote_addr;
-
- proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
-
- }
-
- }
-
后端代理配置文件
- ~# vim/etc/nginx/conf.d/backend.conf
-
- server {
-
- listen 192.168.8.14:10086;
-
- root /var/www/html/app1/;
-
- access_log /var/log/nginx/app1/access.log proxy_format;
-
- real_ip_header X-Forwarded-For;
-
- set_real_ip_from 192.168.0.0/16;
-
- real_ip_recursive on;
-
- location / {
-
- try_files uri uri/ =404;
-
- }
-
- }
-
准备后端服务文件
- mkdir -p /var/www/html/app1/
-
- echo'<h1>backend_app1</h1>' > /var/www/html/app1/index.html
-
- mkdir /var/log/nginx/app1 -p
-
检查nginx配置后重载服务
- /usr/sbin/nginx -t
-
- systemctl reload nginx
-
- netstat -tnulp | grep nginx
-
查看效果
- 在多台主机上执行如下命令
-
- curl http://192.168.8.14
-
查看日志:
- app1日志
-
- 192.168.8.1 - -[12/Nov/2018:18:28:46 -0800] "GET / HTTP/1.0" 200 22 "-""Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, likeGecko) Chrome/67.0.3396.99 Safari/537.36" "192.168.8.1""192.168.8.1"
-
- 192.168.8.14 - -[12/Nov/2018:18:29:30 -0800] "GET / HTTP/1.0" 200 22 "-""curl/7.47.0" "192.168.8.14" "192.168.8.14"
-
- 192.168.8.15 - -[12/Nov/2018:18:31:43 -0800] "GET / HTTP/1.0" 200 22 "-""curl/7.29.0" "192.168.8.15" "192.168.8.15"
-
注意:
- 因为我们的虚拟机使用的是nat网络模型,所以我们用外部的宿主机来访问的话,是通过VMnat8网卡IP来访问nginx代理的,所以记录的是192.168.8.1
-
注意:
- 如果生产中出现了多级代理,
-
- 在第一层代理上添加 proxy_set_headerX-Real-IP $remote_addr;属性
-
- 在所有代理上必须添加 proxy_set_headerX-Forwarded-For $proxy_add_x_forwarded_for;属性
-
- 真实主机上使用 real_ip_header X-Forwarded-For;属性
-
- 隐藏我自己的身份,富豪-渣二代
-
- 隐藏对方的身份,美女,野兽
-