Pages

Sunday, 25 December 2011

.htaccess文件的几个简单应用以及nginx下的rewrite规则

.htaccess 文件 (Hypertext Access file) 是Apache Web服务器的一个非常强大的配置文件,对于这个文件,Apache有一堆参数可以让你配置出几乎随心所欲的功能。.htaccess 配置文件坚持了Unix的一个文化——使用一个ASCII 的纯文本文件来配置你的网站的访问策略。

这篇文章包括了几十个非常有用的小技巧。另外,因为.htaccess 是一个相当强大的配置文件,所以,一个轻微的语法错误会造成你整个网站的故障,所以,在你修改或是替换原有的文件时,一定要备份旧的文件,以便出现问题的时候可以方便的恢复。

.htaccess是在Apache Server这款服务器软件下的一个对于系统目录进行各种权限规则设置的一个文件,存在于Linux操作系统中。比较常见的是定义默认首页名称,404页面,301转向,等等,还有更多的功能比如伪静态,限制图片外链,限制下载,密码保护,去除页面广告等等,还有非常多的功能就不一一列举。
其实这些功能大多可以在cPanel控制面板来进行设置的(相当于是.htaccess的图形化界面)。但对于高手来讲,cPanel对于htaccess提供的功能还是太少了点,手工编辑才是王道。相对于国内的虚拟主机,绝大多数是没有这个功能的

目录规则
一般我们将.htaccess文件放置在网站的根目录,控制所在目录及所有子目录,而如果放置在子目录中,会受上级目录中.htaccess文件影响,是不起任何作用的。

举几个例子,以下部分引用维基百科。

自定义错误页面(直接拷贝即可)

    ErrorDocument 404 /error-pages/not-found.html
    ErrorDocument 503 /error-pages/service-unavailable.html

————————————————————————-
IP禁止

    Order allow,deny
    Deny from 123.45.67.8
    Deny from 123.123.7
    Allow from all

上面能禁止IP地址在123.45.67.8以及IP地址开头为123.123.7的任何人。例如123.123.74.42 就不能得到访问。
————————————————————————-
变更默认首页

    DirectoryIndex homepage.html

————————————————————————-
去除页面广告(不一定适用所有免费空间)

    LayoutIgnoreURI *.php
    LayoutIgnoreURI *.cgi
    LayoutIgnoreURI *.htm
    LayoutIgnoreURI *.html
    LayoutIgnoreURI *.txt

————————————————————————-
页面跳转

    Redirect page1.html page2.html

如果某人访问 http://www.example.com/page1.html,他将被跳转到(带有HTTP状态代码302)的http://www.example.com/page2.html
————————————————————————-
服务器内置SSI

    AddType text/html .shtml
    AddHandler server-parsed .shtml
    Options Indexes FollowSymLinks Includes

    利用.htaccess实现网站图片防盗链功能

    打开自己空间的.htaccess文件,加上以下代码:

    RewriteEngine on
    RewriteCond %{REQUEST_URI} ^/images
    RewriteRule ^.*$ – [L]
    RewriteCond %{REQUEST_FILENAME} \.(jpg|gif|bmp|zip|rar|mp3|txt|png|wma|wmv)$ [NC]
    RewriteCond %{HTTP_REFERER} !^$
    RewriteCond %{HTTP_REFERER} !^$ [NC]
    RewriteCond %{HTTP_REFERER} !www.laoyao.me [NC]
    RewriteCond %{HTTP_REFERER} !laoyao.me [NC]
    RewriteCond %{HTTP_REFERER} !www.zhuaxia.com [NC]
    RewriteCond %{HTTP_REFERER} !www.google.com [NC]
    RewriteCond %{HTTP_REFERER} !google.com [NC]
    RewriteCond %{HTTP_REFERER} !www.google.com.hk [NC]
    RewriteCond %{HTTP_REFERER} !google.com.hk [NC]
    RewriteCond %{HTTP_REFERER} !www.google.cn [NC]
    RewriteCond %{HTTP_REFERER} !google.cn [NC]
    RewriteCond %{HTTP_REFERER} !www.baidu.com [NC]
    RewriteCond %{HTTP_REFERER} !www.baidu.cn [NC]
    RewriteCond %{HTTP_REFERER} !baidu.com [NC]
    RewriteCond %{HTTP_REFERER} !baidu.cn [NC]
    RewriteCond %{HTTP_REFERER} !bloglines.com [NC]
    RewriteCond %{HTTP_REFERER} !www.ask.com [NC]
    RewriteCond %{HTTP_REFERER} !www.163.com [NC]
    RewriteCond %{HTTP_REFERER} !www.yahoo.com [NC]
    RewriteCond %{HTTP_REFERER} !www.sogou.com [NC]
    RewriteCond %{HTTP_REFERER} !www.soso.com [NC]
    RewriteCond %{HTTP_REFERER} !www.sina.com.cn [NC]
    RewriteCond %{HTTP_REFERER} !www.msn.com [NC]
    RewriteCond %{HTTP_REFERER} !www.feedsky.com [NC]
    RewriteCond %{HTTP_REFERER} !www.feedburner.com [NC]
    RewriteRule (.*) /images/error.gif [R,NC,L]特别域名

    RewriteEngine on
    RewriteCond %{HTTP_REFERER} ^http://([^/]+\.)?baddomain1\.com [NC,OR]
    RewriteCond %{HTTP_REFERER} ^http://([^/]+\.)?baddomain2\.com [NC,OR]
    RewriteCond %{HTTP_REFERER} ^http://([^/]+\.)?baddomain3\.com [NC]
    RewriteRule \.(gif|jpg)$ http://www.example.com/hotlink.gif [R,L]

非特别域名

    RewriteEngine on
    RewriteCond %{HTTP_REFERER} !^$
    RewriteCond %{HTTP_REFERER} !^http://(www\.)?example.com/.*$ [NC]
    RewriteRule \.(gif|jpg)$ http://www.example.com/hotlink.gif [R,L]

除非 example.com有这个图片,浏览器才能看到hotlink.gif.
注意:Hotlink热链保护使用 .htaccess 依赖客户端在http GET请求中发送正确的”提交”值。像尝试使用Windows Media Player发送空白的提交到.htaccess 来保护电影档案是无效的。

禁止.htaccess文件被查看
在.htaccess文件中加入如下代码就可以禁止别人访问你的.htaccess文件:

    <Files .htaccess>
    order allow,deny
    deny from all
    </Files>

这个网上的大部分版本都有错误,大部分版本丢掉了<Files .htaccess> ,结果导致所有文件都被禁止访问。如果用了错误的规则,所有内容都将无法访问。

同样道理,如果要禁止其他文件的访问,用其他文件名替换就可以了。

2..htaccess 虚拟主机的妙用

.htaccess文件(或者”分布式配置文件”提供了针对目录改变配置的方法, 即,在一个特定的文档目录中放置一个包含一个或多个指令的文件, 以作用于此目录及其所有子目录。[1]作为用户,所能使用的命令受到限制。管理员可以通过Apache的AllowOverride指令来设置。

- 子目录中的指令会覆盖更高级目录或者主服务器配置文件中的指令。

- .htaccess必须以ASCII模式上传,最好将其权限设置为644。

错误文档的定位

    常用的客户端请求错误返回代码:
    401 Authorization Required
    403 Forbidden
    404 Not Found
    405 Method Not Allowed
    408 Request Timed Out
    411 Content Length Required
    412 Precondition Failed
    413 Request Entity Too Long
    414 Request URI Too Long
    415 Unsupported Media Type
    常见的服务器错误返回代码:
    500 Internal Server Error

用户可以利用.htaccess指定自己事先制作好的错误提醒页面。一般情况下,人们可以专门设立一个目录,例如errors放置这些页面。然后再.htaccess中,加入如下的指令:

    ErrorDocument 404 /errors/notfound.html
    ErrorDocument 500 /errors/internalerror.html

一条指令一行。上述第一条指令的意思是对于404,也就是没有找到所需要的文档的时候得显示页面为/errors目录下的notfound.html页面。不难看出语法格式为:

    ErrorDocument 错误代码 /目录名/文件名.扩展名

如果所需要提示的信息很少的话,不必专门制作页面,直接在指令中使用HTML号了,例如下面这个例子:

    ErrorDocument 401 “
    你没有权限访问该页面,请放弃!
    ”

文档访问的密码保护

要利用.htaccess对某个目录下的文档设定访问用户和对应的密码,首先要做的是生成一个.htpasswd的文本文档,例如:

    zheng:y4E7Ep8e7EYV

这里密码经过加密,用户可以自己找些工具将密码加密成.htaccess支持的编码。该文档最好不要放在www目录下,建议放在www根目录文档之外,这样更为安全些。

有了授权用户文档,可以在.htaccess中加入如下指令了:

    AuthUserFile .htpasswd的服务器目录
    AuthGroupFile /dev/null (需要授权访问的目录)
    AuthName EnterPassword
    AuthType Basic (授权类型)

    require user wsabstract (允许访问的用户,如果希望表中所有用户都允许,可以使用 require valid-user)

注,括号部分为学习时候自己添加的注释

拒绝来自某个IP的访问

如果我不想某个政府部门访问到我的站点的内容,那可以通过.htaccess中加入该部门的IP而将它们拒绝在外。

例如:

    order allow,deny
    deny from 210.10.56.32
    deny from 219.5.45.
    allow from all

第二行拒绝某个IP,第三行拒绝某个IP段,也就是219.5.45.0~219.2.45.255

想要拒绝所有人?用deny from all好了。不止用IP,也可以用域名来设定。

保护.htaccess文档

在使用.htaccess来设置目录的密码保护时,它包含了密码文件的路径。从安全考虑,有必要把.htaccess也保护起来,不让别人看到其中的内容。虽然可以用其他方式做到这点,比如文档的权限。不过,.htaccess本身也能做到,只需加入如下的指令:

    order allow,deny
    deny from all

URL转向

我们可能对网站进行重新规划,将文档进行了迁移,或者更改了目录。这时候,来自搜索引擎或者其他网站链接过来的访问就可能出错。这种情况下,可以通过如下指令来完成旧的URL自动转向到新的地址:

Redirect /旧目录/旧文档名 新文档的地址

或者整个目录的转向:

Redirect 旧目录 新目录

改变缺省的首页文件

一般情况下缺省的首页文件名有default、index等。不过,有些时候目录中没有缺省文件,而是某个特定的文件名,比如在pmwiki中是pmwiki.php。这种情况下,要用户记住文件名来访问很麻烦。在.htaccess中可以轻易的设置新的缺省文件名:

DirectoryIndex 新的缺省文件名

也可以列出多个,顺序表明它们之间的优先级别,例如:

    DirectoryIndex filename.html index.cgi index.pl default.htm

防止盗链

如果不喜欢别人在他们的网页上连接自己的图片、文档的话,也可以通过htaccess的指令来做到。

所需要的指令如下:

    RewriteEngine on
    RewriteCond %{ HTTP_REFERER } !^$
    RewriteCond %{ HTTP_REFERER } !^http://(www.)?mydomain.com/.*$ [NC]
    RewriteRule .(gif&line;jpg)$ – [F]

如果觉得让别人的页面开个天窗不好看,那可以用一张图片来代替:

    RewriteEngine on
    RewriteCond %{ HTTP_REFERER } !^$
    RewriteCond %{ HTTP_REFERER } !^http://(www.)?mydomain.com/.*$ [NC]

3.htaccess重写让空间绑定多个域名到不同的目录支持多站点

、.htaccess代码如下,注意你可能需要作一些调整和修改,注释我已经写在旁边了。PS:我的Godaddy的空间原来的域名是 baidu0.tk,我利用.htaccess重写将另一个域名0baidu.tk绑定到另外一个目录当中,这样我利用Godaddy经济型空间建立了多个网站(原来是不具备这个功能的)。

        <IfModule mod_rewrite.c>
        # 关闭目录列表
        Options -Indexes
        RewriteEngine on
        # 预设页面
        DirectoryIndex default.html index.html default.html index.htm default.php index.php
        # 统一网址,去掉www。如果你想保留www,自己在第二行添加
        RewriteCond %{HTTP_HOST} ^0baidu.tk[NC]
        RewriteRule ^(.*)$ http://0baidu.tk/$1 [L,R=301]
        # 将域名绑定在特定的目录当中。0baiud.tk是我建立的文件目录
        RewriteCond %{HTTP_HOST} ^(www.)?0baidu.tk$ [NC]
        RewriteRule ^(.*)$ /0baidu.tk/$1 [L]
        </IfModule>



再将下面的代码按照上面的方法保存为.htaccess,上传到你想要将域名绑定的目录文件夹当中,例如我想将0baidu.tk这个域名绑定在0baidu.tk这个文件夹当中,那么我用FTP新建了0baidu.tk文件夹,将.htaccess文件放在这里。

    <IfModule mod_rewrite.c>
    RewriteEngine on
    RewriteBase /0baidu.tk/
    </IfModule>

完成以上步骤后,我们就已经成功利用.htaccess重写在Godaddy经济型号的空间上建立起了多个域名多个站点了,如果你以后想建立三个站,甚至更多的站,按照上面的方法,选择绑定好域名,然后添加.htaccess语句即可。

1. 使用.htaccess 创建自定义的出错页面。对于Linux Apache来说这是一项极其简单的事情。使用下面的.htaccess语法你可以轻松的完成这一功能。(把.htaccess放在你的网站根目录下)

    ErrorDocument 401 /error/401.php
    ErrorDocument 403 /error/403.php
    ErrorDocument 404 /error/404.php
    ErrorDocument 500 /error/500.php

2. 设置网站的时区

    SetEnv TZ America/Houston

3. 阻止IP列表
有些时候,你需要以IP地址的方式阻止一些访问。无论是对于一个IP地址还是一个网段,这都是一件非常简单的事情,如下所示:

    allow from all
    deny from 145.186.14.122
    deny from 124.15

Apache对于被拒绝的IP会返回403错误。

4. 把一些老的链接转到新的链接上——搜索引擎优化SEO

    Redirect 301 /d/file.html http://www.htaccesselite.com/r/file.html

5. 为服务器管理员设置电子邮件。

    ServerSignature EMail
    SetEnv SERVER_ADMIN default@domain.com

6. 使用.htaccess 访止盗链。如果你网站上的一个图片被别的N多的网站引用了,那么,这很有可能会导致你服务器的性能下降,使用下面的代码可以保护某些热门的链接不被过多的引用。

    Options +FollowSymlinks
    # Protect Hotlinking
    RewriteEngine On
    RewriteCond %{HTTP_REFERER} !^$
    RewriteCond %{HTTP_REFERER} !^http://(www.)?domainname.com/ [nc]
    RewriteRule .*.(gif|jpg|png)$ http://domainname.com/img/hotlink_f_o.png [nc]

7. 阻止 User Agent 的所有请求

    ## .htaccess Code :: BEGIN
    ## Block Bad Bots by user-Agent
    SetEnvIfNoCase user-Agent ^FrontPage [NC,OR]
    SetEnvIfNoCase user-Agent ^Java.* [NC,OR]
    SetEnvIfNoCase user-Agent ^Microsoft.URL [NC,OR]
    SetEnvIfNoCase user-Agent ^MSFrontPage [NC,OR]
    SetEnvIfNoCase user-Agent ^Offline.Explorer [NC,OR]
    SetEnvIfNoCase user-Agent ^[Ww]eb[Bb]andit [NC,OR]
    SetEnvIfNoCase user-Agent ^Zeus [NC]

    Order Allow,Deny
    Allow from all
    Deny from env=bad_bot

    ## .htaccess Code :: END

8. 把某些特殊的IP地址的请求重定向到别的站点

    ErrorDocument 403 http://www.youdomain.com
    Order deny,allow
    Deny from all
    Allow from ip
    Allow from ip

9. 直接找开文件而不是下载 – 通常,我们打开网上文件的时候总是会出现一个对话框问我们是下载还是直接打开,使用下面的设置就不会出现这个问题了,直接打开。

    AddType application/octet-stream .pdf
    AddType application/octet-stream .zip
    AddType application/octet-stream .mov

10. 修改文件类型 – 下面的示例可以让任何的文件都成为PHP那么被服务器解释。比如:myphp, cgi,phtml等。

    ForceType application/x-httpd-php
    SetHandler application/x-httpd-php

11. 阻止存取.htaccess 文件

    # secure htaccess file
    order allow,deny
    deny from all

12. 保护服务器上的文件被存取

    # prevent access of a certain file order allow,deny
    deny from all

13. 阻止目录浏览

    # disable directory browsing
    Options All -Indexes

14. 设置默认主页

    # serve alternate default index page
    DirectoryIndex about.html

15. 口令认证 – 你可以创建一个文件用于认证。下面是一个示例:

    # to protect a file

    AuthType Basic
    AuthName “Prompt”
    AuthUserFile /home/path/.htpasswd
    Require valid-user

    # password-protect a directory
    resides
    AuthType basic
    AuthName “This directory is protected”
    AuthUserFile /home/path/.htpasswd
    AuthGroupFile /dev/null
    Require valid-user

16. 把老的域名转像新的域<实现反向代理>

    # redirect from old domain to new domain
    RewriteEngine On
    RewriteRule ^(.*)$ http://www.yourdomain.com/$1 [R=301,L]

17.利用.htaccess绑定域名到子目录

前提
首先得把域名绑定绑定了,比如把dev.ccvita.com解析到211.136.108.190这个IP
其次是在网站管理面板里,为网站绑定dev.ccvita.com
最后编辑配置.htaccess文件,就可以了。如果没有开启.htaccess请访问下面的内容

    .htaccess文件内容
    RewriteEngine on
    # 把 ccvita.com 改为你要绑定的域名.
    RewriteCond %{HTTP_HOST} ^(www.)?ccvita.com$

    # 把 subfolder 改为要绑定的目录.
    RewriteCond %{REQUEST_URI} !^/subfolder/

    # 不要改以下两行.
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d

    # 把 dev 改为要绑定的目录.
    RewriteRule ^(.*)$ /dev/$1

    # 把 ccvita.com 改为你要绑定的域名
    # 把 dev 改为要绑定的目录.
    # dev/ 后面是首页文件index.php, index.html
    RewriteCond %{HTTP_HOST} ^(www.)?ccvita.com$
    RewriteRule ^(/)?$ dev/index.php [L]

18.修改 .htaccess 实现 301 重定向

出于 SEO、PR 值传递、网址转换的目的,在网站初建和网站迁移时我们都需要使用 301 重定向,通常包括域名对域名,目录对目录和一个独立网址对另一个独立网址的重定向。在虚拟主机上作 301 重定向,最常用的方法有2种:

1.直接编辑 .htaccess。

2.用 cPanel 设定。

实质二者都是修改文件 .htaccess,只是前者手工编辑,后者是由 cPanel 完成。用 cPanel 操作相当简单,登陆你的 cPanel–>Domain–>Redirects,选择相应的选项即可完成设置,这里暂不讨论。下面讲一下直接编辑 .htaccess 的方法。

注意:在设置 301 重定向之前务必备份相应目录下的.htaccess文件。

1.重定向domain.com到www.domain.com

这种重定向旨在使域名唯一,是网站SEO必须要做的,后面重定向www.domain.com到domain.com也是出于同样的原因,只是形式不同。打开.htaccess文件,加入以下规则。(下面的规则是针对主域名的,子域名要修改)

    RewriteEngine On
    RewriteCond %{HTTP_HOST} !^www.domain.com$ [NC]
    RewriteRule ^(.*)$ http://www.domain.com/$1 [L,R=301]

2.重定向www.domain.com到domain.com

    RewriteEngine On
    RewriteCond %{HTTP_HOST} !^domain.com$ [NC]
    RewriteRule ^(.*)$ http://domain.com/$1 [L,R=301]

3.重定向olddomain.com到www.newdomain.com

    RewriteEngine On
    RewriteCond %{HTTP_HOST} !olddomain.com$ [NC]
    RewriteRule ^(.*)$ http://www.newdomain.com/$1 [L,R=301]

4.重定向olddomain.com to newdomain.com

    RewriteEngine On
    RewriteBase /
    RewriteCond %{HTTP_HOST} !olddomain.com$ [NC]
    RewriteRule ^(.*)$ http://newdomain.com/$1 [L,R=301]

5.重定向domain.com/file/file.php 到 otherdomain.com/otherfile/other.php

    RewriteCond %{HTTP_HOST} ^www.domain.com$
    RewriteRule ^file/file.php$ http://www.otherdomain.com/otherfile/other.php [R=301,L]
--------------------------------------------------------------
 .htaccess文件(或者”分布式配置文件”)提供了针对目录改变配置的方法, 即,在一个特定的文档目录中放置一个包含一个或多个指令的文件, 以作用于此目录及其所有子目录。作为用户,所能使用的命令受到限制。管理员可以通过Apache的AllowOverride指令来设置。

   笼统地说,.htaccess可以帮我们实现包括:文件夹密码保护、用户自动重定向、自定义错误页面、改变你的文件扩展名、封禁特定IP地址的用户、只允许特定IP地址的用户、禁止目录列表,以及使用其他文件作为index文件等一些功能。

下面是一个利用.htaccess来设置301重定向的例子


设置.htaccess文件,把带WWW的域名定向到不带WWW域名,或者把一个域名重定向到另一个域名,都可以这样设置:  

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.urdomain.com [NC]
RewriteRule ^(.*)$ http://urdomain.com/$1 [L,R=301]

域名去掉www,且不影响搜索,应该只有这个方法了。

反过来要加上www的:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^urdomain.com [NC]
RewriteRule ^(.*)$ http://www.urdomain.com/$1 [L,R=301]
-------------------------------------------------------------
Linux中.htaccess文件使用技巧

子目录中的指令会覆盖更高级目录或者主服务器配置文件中的指令。
.htaccess必须以ASCII模式上传,最好将其权限设置为 644。

错误文档的定位

常用的客户端请求错误返回代码:
401AuthorizationRequired
403Forbidden
404NotFound
405MethodNotAllowed
408RequestTimedOut
411ContentLengthRequired
412PreconditionFailed
413RequestEntityTooLong
414RequestURITooLong
415UnsupportedMediaType
常见的服务器错误返回代码:
500InternalServerError

用户可以利用.htaccess指定自己事先制作好的错误提醒页面。一般情况下,人们可以专门设立一个目录,例如errors放置这些页面。然后再.htaccess中,加入如下的指令:

ErrorDocument404/errors/notfound.html
ErrorDocument500/errors/internalerror.html

一条指令一行。上述第一条指令的意思是对于404,也就是没有找到所需要的文档的时候得显示页面为/errors目录下的notfound.html页面。不难看出语法格式为:

ErrorDocument错误代码/目录名/文件名.扩展名

如果所需要提示的信息很少的话,不必专门制作页面,直接在指令中使用HTML号了,例如下面这个例子:

ErrorDocument401″<bodybgcolor=#ffffff& gt;<h1>你没有权限访问该页面,请放弃!</h1></body>”

文档访问的密码保护

要利用.htaccess对某个目录下的文档设定访问用户和对应的密码,首先要做的是生成一个.htpasswd的文本文档,例如:

zheng:y4E7Ep8e7EYV

这里密码经过加密,用户可以自己找些工具将密码加密成.htaccess支持的编码。该文档最好不要放在www目录下,建议放在www根目录文档之外,这样更为安全些。

有了授权用户文档,可以在.htaccess中加入如下指令了:

AuthUserFile.htpasswd的服务器目录
AuthGroupFile/dev /null(需要授权访问的目录)
AuthNameEnterPassword
AuthTypeBasic(授权类型)

requireuserwsabstract(允许访问的用户,如果希望表中所有用户都允许,可以使用requirevalid-user)

注,括号部分为学习时候自己添加的注释

拒绝来自某个IP的访问

如果我不想某个政府部门访问到我的站点的内容,那可以通过.htaccess中加入该部门的IP而将它们拒绝在外。

例如:

orderallow,deny
denyfrom210.10.56.32
denyfrom219.5.45.
allowfromall

第二行拒绝某个IP,第三行拒绝某个IP段,也就是219.5.45.0~219.2.45.255

想要拒绝所有人?用 denyfromall好了。不止用IP,也可以用域名来设定。

保护.htaccess文档

在使用.htaccess来设置目录的密码保护时,它包含了密码文件的路径。从安全考虑,有必要把.htaccess也保护起来,不让别人看到其中的内容。虽然可以用其他方式做到这点,比如文档的权限。不过,.htaccess本身也能做到,只需加入如下的指令:

<Files.htaccess>
orderallow,deny
denyfromall
</Files>

URL 转向

我们可能对网站进行重新规划,将文档进行了迁移,或者更改了目录。这时候,来自搜索引擎或者其他网站链接过来的访问就可能出错。这种情况下,可以通过如下指令来完成旧的URL自动转向到新的地址:

Redirect/旧目录/旧文档名新文档的地址

或者整个目录的转向:

Redirect旧目录新目录

改变缺省的首页文件

一般情况下缺省的首页文件名有default、index等。不过,有些时候目录中没有缺省文件,而是某个特定的文件名,比如在pmwiki中是pmwiki.php。这种情况下,要用户记住文件名来访问很麻烦。在.htaccess中可以轻易的设置新的缺省文件名:

DirectoryIndex新的缺省文件名

也可以列出多个,顺序表明它们之间的优先级别,例如:

DirectoryIndexfilename.htmlindex.cgiindex.pldefault.htm

防止盗链

如果不喜欢别人在他们的网页上连接自己的图片、文档的话,也可以通过htaccess的指令来做到。

所需要的指令如下:

RewriteEngineon
RewriteCond%!^$
RewriteCond%!^http://(www\.)?chinahtml.com/.*$[NC]
RewriteRule\.(gif|jpg)$-[F]

如果觉得让别人的页面开个天窗不好看,那可以用一张图片来代替:

RewriteEngineon
RewriteCond%!^$
RewriteCond%!^http://(www\.)?chinahtml.com/.*$[NC]
RewriteRule\. (gif|jpg)$http://www.chinahtml.com/替代图片文件名[R,L]
-------------------------------------------------------------------------
Htaccess文件用法集锦

使用Linux服务器的童鞋建站过程中经常会接触到htaccess,其实它除了常用的伪静态,301转发以外,还有很多强大的功能哦。

1.时区设置
有些时候,当你在PHP里使用date或mktime函数时,由于时区的不同,它会显示出一些很奇怪的信息。下面是解决这个问题的方法之一。就是设置你的服务器的时区。你可以在这里找到所有支持的时区的清单。

SetEnv TZ Australia/Melbourne

2. 搜索引擎友好的301永久转向方法
为什么这是搜索引擎友好的呢?因为现在很多现代的搜索引擎都有能根据检查301永久转向来更新它现有的记录的功能。

Redirect 301 http://go.urdomain.com/ http://www.urdomain.com/

3. 屏蔽下载对话框
通常,当你下载东西的时候,你会看到一个对话框询问你是保持这个文件还是直接打开它。如果你不想看到这个东西,你可以把下面的一段代码放到你的.htaccess文件里。

AddType application/octet-stream .pdf

AddType application/octet-stream .zip

AddType application/octet-stream .mov

4. 省去www前缀
SEO的一个原则是,确保你的网站只有一个URL。因此,你需要把所有的通过www的访问转向的非www,或者反这来。(即301跳转。注意在apache server下,要编辑apache2.conf或httpd.conf,把里面的allow override none改为allow override all)

RewriteEngine On

RewriteCond %{HTTP_HOST} ^www.aqee.net [NC]

RewriteRule ^(.*)$ http://urdomain.com/$1 [L,R=301]

5. 个性化Error页面
对每个错误代码定制自己个性化的错误页面。

ErrorDocument 401 /error/401.php

ErrorDocument 403 /error/403.php

ErrorDocument 404 /error/404.php

ErrorDocument 500 /error/500.php

6. 压缩文件
通过压缩你的文件体积来优化网站的访问速度。

# 压缩 text, html, javascript, css, xml:

AddOutputFilterByType DEFLATE text/plain

AddOutputFilterByType DEFLATE text/html

AddOutputFilterByType DEFLATE text/xml

AddOutputFilterByType DEFLATE text/css

AddOutputFilterByType DEFLATE application/xml

AddOutputFilterByType DEFLATE application/xhtml+xml

AddOutputFilterByType DEFLATE application/rss+xml

AddOutputFilterByType DEFLATE application/javascript

AddOutputFilterByType DEFLATE application/x-javascript

7. 缓存文件
缓存文件是另外一个提高你的网站访问速度的好方法。
Header set Cache-Control “max-age=2592000″

8. 对某些文件类型禁止使用缓存
而另一方面,你也可以定制对某些文件类型禁止使用缓存。

# 显式的规定对脚本和其它动态文件禁止使用缓存
 

Header unset Cache-Control 



安全问题
下面的htaccess代码能够提高你的web服务器的安全水平。图片链接盗用保护非常有用,它能防止其他人偷盗使用你的服务器上的图片资源。

1. 通过.htaccess放盗链
痛恨那些偷盗链接你的web服务器上的图片资源而耗尽了你的带宽的行为吗?试试这个,你可以防止这种事情的发生。

RewriteBase /

RewriteCond %{HTTP_REFERER} !^$

RewriteCond %{HTTP_REFERER} !^http://(www.)?urdomain.com/.*$ [NC]

RewriteRule .(gif|jpg|swf|flv|png)$ /feed/ [R=302,L]

2. 防黑客
如果你想提高网站的安全等级,你可以去掉下面的几行代码,这样可以防止一些常见恶意URL匹配的黑客攻击技术。

RewriteEngine On 

# proc/self/environ? 没门! 
RewriteCond %{QUERY_STRING} proc/self/environ [OR] 
 
# 阻止脚本企图通过URL修改mosConfig值 
RewriteCond %{QUERY_STRING} mosConfig_[a-zA-Z_]{1,21}(=|\%3D) [OR] 

# 阻止脚本通过URL传递的base64_encode垃圾信息 
RewriteCond %{QUERY_STRING} base64_encode.*(.*) [OR]
----------------------------------------------------------
自动把apache的.htaccess转换为nginx的rewrite规则


apache下可用的htaccess,我们需要将其转换为nginx下可用的规则。
找到个不错的在线自动转换工具 点这里前往
(也可用这个:http://www.onexin.net/rewrite.php),用这个转换
之后,需要修改nginx的配置文件:
location / {
此处放置自动转换后的nginx规则
}
 把自动转换后的nginx规则放在server段里面也可。
你也可以把那段代码存为一个conf文件或.htaccess,然后通过include调用该conf文件或.htaccess文件。(提醒一下:apache下的htaccess与nginx用的规则是不同的。 当然,在新建这个conf文件或.htacess时,也可以用任意名字,那么在include时对应写正确就行了。)

nginx的rewrite规则的例子(301跳转):
if ($http_host ~* "^brite.net.ms"){
set $rule_0 1$rule_0;
}
if ($rule_0 = "1"){
rewrite ^/(.*)$ http://as.brite.biz/$1 permanent;
}
-------------------------------------------------------

Nginx Rewrite Rules



If you are a CodeIgniter enthusiast, you know that finding rewrite rules for Apache (htaccess file) is relatively easy, but doing the same for Nginx rewrite rules is not all that simple. Use these Nginx rewrite rules to get your next CodeIgniter project up and running.

So I had a little fun with Nginx this weekend, I setup a rackspace server, installed Nginx (with PHP and MySQL), and installed CodeIgniter.
If you are a CodeIgniter enthusiast, you know that finding rewrite rules for Apache (htaccess file) is relatively easy, but doing the same for Nginx rewrite rules is not all that simple. The rules that follow are from my original article: CodeIgniter htaccess (for Apache) and are an exact translation into Nginx rewrite rules.

CodeIgniter Nginx Config

Here is the entire config file that I use. Remember that some of these rules are commented out, you will have to explicitly enabled them by removing the comments (removing the “#” from in front of the rule).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
server
{
    server_name .example.com;
    access_log /var/log/nginx/example.com.access.log;
    root /var/www/example.com/html;
    index index.php index.html index.htm;
    # enforce www (exclude certain subdomains)
#   if ($host !~* ^(www|subdomain))
#   {
#       rewrite ^/(.*)$ $scheme://www.$host/$1 permanent;
#   }
    # enforce NO www
    if ($host ~* ^www\.(.*))
    {
        set $host_without_www $1;
        rewrite ^/(.*)$ $scheme://$host_without_www/$1 permanent;
    }
    # canonicalize codeigniter url end points
    # if your default controller is something other than "welcome" you should change the following
    if ($request_uri ~* ^(/welcome(/index)?|/index(.php)?)/?$)
    {
        rewrite ^(.*)$ / permanent;
    }
    # removes trailing "index" from all controllers
    if ($request_uri ~* index/?$)
    {
        rewrite ^/(.*)/index/?$ /$1 permanent;
    }
    # removes trailing slashes (prevents SEO duplicate content issues)
    if (!-d $request_filename)
    {
        rewrite ^/(.+)/$ /$1 permanent;
    }
    # removes access to "system" folder, also allows a "System.php" controller
    if ($request_uri ~* ^/system)
    {
        rewrite ^/(.*)$ /index.php?/$1 last;
        break;
    }
    # unless the request is for a valid file (image, js, css, etc.), send to bootstrap
    if (!-e $request_filename)
    {
        rewrite ^/(.*)$ /index.php?/$1 last;
        break;
    }
    # catch all
    error_page 404 /index.php;
    # use fastcgi for all php files
    location ~ \.php$
    {
        fastcgi_pass 127.0.0.1:9000;
        fastcgi_index index.php;
        fastcgi_param SCRIPT_FILENAME /var/www/example.com/html$fastcgi_script_name;
        include fastcgi_params;
    }
    # deny access to apache .htaccess files
    location ~ /\.ht
    {
        deny all;
    }
}

Some Very Important Notes

I spent nearly half a day testing out these rules, so here are some important things I noticed:
  • The PHP DOCUMENT_ROOT environment variable is derived from the root parameter and setting root on the server level vs within a location block is important.
  • Using the rewrite rules at the server level vs within location block is also key in their proper functionality, certain rules will not work properly otherwise.

Nginx Rewrite Rule Breakdown

The first set of rules allow you to enforce “www” or enforce NO “www”, you will have to pick which you prefer and enable one or the other. Additionally, for those who may have subdomains, adding the subdomains to the list (if enforcing www) will safely exclude those subdomains from being redirected.
11
12
13
14
15
16
17
18
19
20
21
22
# enforce www (exclude certain subdomains)
#if ($host !~* ^(www|subdomain))
#{
#   rewrite ^/(.*)$ $scheme://www.$host/$1 permanent;
#}
# enforce NO www
if ($host ~* ^www\.(.*))
{
    set $host_without_www $1;
    rewrite ^/(.*)$ $scheme://$host_without_www/$1 permanent;
}
I’ve also made some additions in an attempt to Canonicalize some of the CodeIgniter URL end points. The key benefit of a Canonicalized URL is that your search engine page ranking (page juice) is not spread across several pages, but instead, targeted to a single page.
In your CodeIgniter project you will typically have a default controller and you will be able to access this controller at the following URLs:
/
/welcome
/welcome/
/welcome/index
/welcome/index/
/index.php
That’s a total of 6 URL end points pointing to the front controller. Additionally other controllers you’ve created will also have a default “index” method, consider the following:
/category
/category/index
/category/index/
Again, a total of 3 URL end points where there should only be one. These next set of rewrite rules prevent this:
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
# canonicalize codeigniter url end points
# if your default controller is something other than "welcome" you should change the following
if ($request_uri ~* ^(/welcome(/index)?|/index(.php)?)/?$)
{
    rewrite ^(.*)$ / permanent;
}
# removes trailing "index" from all controllers
if ($request_uri ~* index/?$)
{
    rewrite ^/(.*)/index/?$ /$1 permanent;
}
# removes trailing slashes (prevents SEO duplicate content issues)
if (!-d $request_filename)
{
    rewrite ^/(.+)/$ /$1 permanent;
}
With these rules the front controller will always be accessed at “/” and any other URLs pointing to a controller’s “index” method will be accessed at “/controller”. Notice that I also use a 301 redirect, this aids in maintaining or passing any existing search engine ranking (page juice) to the final redirected page.
So these:
/welcome
/welcome/
/welcome/index
/welcome/index/
/index.php
… would simple become:
/
… and:
/category
/category/index
/category/index/
… would become:
/category
Another important thing to note: for controllers with an “index” method which take any sort of parameter, these URLs will still work as such:
/welcome/index/123
/category/index/123
To be able to remove the “index” (or “welcome/index”) and still have parameters passed in, you will need to configure your routes file.
The next rule prevents access to the system directory and additionally allows you to have a System.php controller file.
43
44
45
46
47
48
# removes access to "system" folder, also allows a "System.php" controller
if ($request_uri ~* ^/system)
{
    rewrite ^/(.*)$ /index.php?/$1 last;
    break;
}
And the final rule is the catch all to route all requests to the bootstrap file.
50
51
52
53
54
55
# unless the request is for a valid file (image, js, css, etc.), send to bootstrap
if (!-e $request_filename)
{
    rewrite ^/(.*)$ /index.php?/$1 last;
    break;
}

Apply These Final Touches to Clean Up the URL

Remember, once you have your CodeIgniter Nginx config setup, you will want to go into your “/system/application/config/config.php”, find the following:
$config['index_page'] = "index.php";
and change it to:
$config['index_page'] = "";
Because you are using Nginx rewrites, the above will set your config file so that “index.php” will NOT show up as part of the URL as such:
instead your URLs will be cleaner:
If you have comments or improvement suggestions please let me know.

from http://www.farinspace.com/codeigniter-nginx-rewrite-rules/
-----------------------------------------------------------------------------------

详解RewriteCond


RewriteCond 重写规则执行条件
语法: RewriteCond TestString CondPattern
生效域: server config, virtual host, directory, .htaccess
特别的上面的 TestString, 可提供反向引用. 引用模式为: %N 其中N为(0 <= N <=9), 引用当前若干RewriteCond条件中最后符合的条件中的分组成分, 也就是括号里的内容.不过用到的不多. 反向应用多在RewriteRule里常用.
RewriteCond 语法中的 TestStrng 为要被检查的内容, CondPattern 是进行匹配的规则, 它是一个兼容Perl风格的正则表达式和一些其他的特有字符属性. 这里介绍一下.
第一个: ! (感叹号) 表示否的意思. 比如一个条件: 判断访问此页面的上一页URL是否包含 sex 字符的话可以用这样: RewriteCond %{HTTP_REFERER} !(sex)
第二个: < 就是小于的意思, TestString < CondPattern.
第三个: > 就是大于于的意思, TestString < CondPattern.
第四个: = 相等的意思. <, >, = 三个和通常程序语言使用的 <, >, = 功能类似.
第五个: -d 是否是一个目录. 判断TestString是否不是一个目录可以这样: !-d
第六个: -f 是否是一个文件. 判断TestString是否不是一个文件可以这样: !-f
第七个: -s 是否是一个正常的有大小的文件. 判断TestString是否不是一个正常的有大小的文件可以这样: !-s
第八个: -l 是否是一个快捷方式文件. 判断TestString是否不是一个快捷方式文件可以这样: !-l
第九个: -x 是否是一个文件并且又执行权限. 判断TestString是否不是一个文件并且又执行权限可以这样: !-x
第十个: -F 检查TestString是否是一个合法的文件,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部subrequest完成的, 因此需要小心使用这个功能以降低服务器的性能。
第十一个: -U 检查TestString是否是一个合法的URL,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部subrequest完成的, 因此需要小心使用这个功能以降低服务器的性能.
另外: RewriteCond 指令后面可带 Flag, 现在只要2个可用, 一个是 NC|nocase, 不区分大小写的意思. 一个是 OR|ornext 表示连接下一个条件的意思.
RewriteCond 实际需要使用情况比如要判断一个条件成真的时候才执行相关的重写操作. 紧接着它下面的 RewriteRule 总是在RewriteCond 条件判断为真的时候才被执行.
看下面的一个例子:
#开启服务器重写模式
RewriteEngine on
#来自 www.test.cn 的连接访问本站时都只能访问 test.php 这页.
RewriteCond %{HTTP_REFERER} (www.l-yp.com)
RewriteRule (.*)$ 404.html
#来自 www.test.com 的连接访问本站时都只能访问 newTest.php 这页.
RewriteCond %{HTTP_REFERER} (www.l-yp.com)
RewriteRule (.*)$ 404.html
OK, RewriteCond 就介绍到这里了. 其实很简单. 就像程序里的 if() 这样的效果.
----------------------------------------------------------------------------------------
配置apache的.htaccess

转自http://forum.ubuntu.org.cn/viewtopic.php?f=43&t=18587
打开默认站点配置文件(修改这就不要修改apache2.conf,因为apache2.conf会include这个配置文件)
代码:
gksu gedit /etc/apache2/sites-available/default
先介绍默认配置
代码:
Options Indexes FollowSymLinks MultiViews
AllowOverride None
Order allow,deny
allow from all
Options Indexes FollowSymLinks MultiViews 中
Indexed指当没能找到默认网页(如index.htm等)时,将目录内容生成为含子目录、文件超链接列表的网页;
FollowSymLinks指若文件系统存在链接,则用URL访问时也可按链接访问,即若你创建目录A的链接文件到目录B,在B下双击链接文件A就可进入A,同样也可以在URL中用http://….B/A来访问A;
MultiViews大致指服务器端可以根据实际情况进行配置,如在目录下找不到index.htm时会自动寻找index.php,使用同上次访问的某些设置。
AllowOverride 指目录及其子目录是否可以用.htaccess文件控制访问权限
Order allow,deny 指Allow指令在 Deny指令之前被评估。缺省禁止所有访问。任何不匹配Allow指令或者匹配 Deny指令的客户都将被禁止访问服务器。
解决办法,在里面添加
代码:
AllowOverride All
Order allow,deny
allow from 127.0.0.1
首 先的目录路径是apache实际访问时的路径,因为我是给phpmyadmin做了一个链接到/var/www/,所以apache访问 phpmyadmin是通过/var/www/phpmyadmin而不是/usr/share/phpmyadmin。而且如果你在多处用了链接,如还 有目录链接/var/www/admin/phpmyadmin,你就要再写一个
其次,因为/var/www设置了allow from all,如果我们只想让本机访问phpmyadmin,那就要覆盖掉原设置,
代码:
Order allow,deny
allow from 127.0.0.1
还要设置phpmyadmin及其子目录允许.htaccess文件控制访问权限
代码:
AllowOverride All
apache相关命令
关闭apache
代码:
sudo /usr/sbin/apache2ctl stop
启动apache
代码:
sudo /usr/sbin/apache2ctl start
重启apache(有时候重启不会改变设置,要先关闭、再启动)
代码:
sudo /usr/sbin/apache2ctl restart
重启firefox、apache再访问就起效了。
如果phpmyadmin启用了.htaccess权限控制,没有在上级目录列表中出现,就通过URL直接访问http://localhost/phpmyadmin
apache等的详细文档http://w.yi.org/ftp/FAPM/
---------------------------------------------------
网站更换域名,但不想流失现有人流,这里通过apache mod_rewrite模块实现

只需要在旧网站的根目录下创建.htaccess 档案,并加入内容:
<IfModule mod_rewrite.c>
RewriteEngine On

RewriteCond %{HTTP_HOST} ^job.domin.com [NC]
RewriteRule ^(.*)$ http://job.newdomin.cn/$1 [R,L=301]
</IFModule>
#以上内容自行修改域名部分。
使用.htaccess,需要修改httpd.conf文件,找到
<Directory "/home/htdoc">
    Options FollowSymLinks Includes
    #
    # AllowOverride controls what directives may be placed in .htaccess files.
    # It can be "All", "None", or any combination of the keywords:
    #   Options FileInfo AuthConfig Limit
    #注意这里红色突出的内容
    AllowOverride All    
  其次,使用301 .htaccess 重定向需要apache开启mod_rewrite功能,如何编译开启mod_rewrite,请参考我的文章。
最后,重启apache服务。
今天逛到一个好东西,自动生成.htaccess
http://cooletips.de/htaccess/  
http://www.wangqu.org/htaccess/
-----------------------------------------------
Nginx的Rewrite rule
经过网上查阅和测试,发现Nginx的Rewrite规则和Apache的Rewite规则差别不是很大,几乎可以直接使用。比如在Apache中这样写规则
rewrite ^/([0-9]{5}).html$ /viewthread.php?tid=$1 last;
而在Nginx中写成这样写是无法启动的,解决的办法是加上两个双引号:
rewrite “^/([0-9]{5}).html$” /viewthread.php?tid=$1 last;
同时将RewriteRule为Rewrite,基本就实现了Nginx的Rewrite规则到Apache的Rewite规则的转换。
Rewrite的Flags
last - 基本上都用这个Flag。
break - 中止Rewirte,不在继续匹配
redirect - 返回临时重定向的HTTP状态302
permanent - 返回永久重定向的HTTP状态301

官方文档请点击这里: http://wiki.nginx.org/NginxHttpRewriteModule
----------------

How to Set Redirection Rules in NGINX Webserver?
The rewrite rules are used to redirect one URL to another URL or to invoke an internal proxy fetch. Most of the people who are using shared hosting, they used to configure rewrite rules in Apache’s .htaccess file and they also try to use that redirect rule in nginx web server.
To something like this:
server {
listen       80;
server_name  www.example.org  example.org;
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ Error! Hyperlink reference not valid. [L,R=301]
}
This is wrong and ineffective. In this tutorial, we will discuss how to create rewrite rules in NGINX. Now I introduce some common redirection rule in NGINX like HTTP to HTTPS, old domain to new domain etc.
In NGINX webserver, it needs to edit the current configuration file to set redirection. First, make a backup of the current config file before doing anything. It’s very important to take a backup because if we do something wrong the whole site will down. You can take a copy of config file using “cp” command.
Assume that my current config file name is “mydomain.com”, use this command to take a backup.
cp mydomain.com mydomain_back.com
Then open your config file with an editor.
vi mydomain.com

Redirecting from an old name to new name
server {
listen 80;
listen 443 ssl;
server_name www.mydomain.com mydomain.com;
return 301 $scheme://www.new-mydomain.com$request_uri;
}

This sample NGINX rewrite rule permanently redirects requests from www.mydomain.com and mydomain.com to www.new‑mydomain.com, using two NGINX variables to capture values from the original request URL – $scheme is the original protocol (http or https) and $request_uri is the full URL (following the domain name), including arguments. Because $request_uri captures the portion of the URL that follows the domain name, this rewrite is suitable if there’s a one‑to‑one correspondence of pages between the old and new sites (for example, www.new‑mydomain.com/about has the same basic content as www.mydomain.com/about)

Adding and removing “www” prefix
ADD www prefix:
# add ‘www’
server {
listen 80;
listen 443 ssl;
server_name mydomain.com;
return 301 $scheme://www.mydomain.com$request_uri;
}
Remove www prefix:
# remove ‘www’
server {
listen 80;
listen 443 ssl;
server_name www.mydomain.com;
return 301 $scheme://mydomain.com$request_uri;
}
Redirecting all traffic to the correct domain name
Here’s a special case that redirects incoming traffic to the website’s homepage when the request URL doesn’t match any server and location blocks, perhaps because the domain name is misspelled. It works by combining the default_server parameter to the listen directive and the underscore as the parameter to the server_name directive.
server {
listen 80 default_server;
listen 443 ssl default_server;
server_name _;
return 301 $scheme://www.mydomain.com;
}

Redirecting all request forcing to https(SSL/TLS)
This server block forces all visitors to use a secured (SSL/TLS) connection to your site.
server {
listen 80;
server_name www.mydomain.com;
return 301 https://www.mydomain.com$request_uri;
}
Finally, you need to restart “nginx” service to effect these redirections.
service nginx restart
or
/etc/init.d/nginx restart