apache使用.htaccess文件实现屏蔽wget下载网站内容
经发现,虽然wget遵循robots.txt规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家:
1.屏蔽下载任何文件
.htaccess
SetEnvIfNoCaseUser-Agent"^wget"bad_bot <LimitGETPOST> OrderAllow,Deny Allowfromall Denyfromenv=bad_bot </Limit>
2.屏蔽下载部分文件
.htaccess
SetEnvIfNoCaseUser-Agent"^Wget"bad_bot SetEnvIfNoCaseUser-Agent"^Wget/1.5.3"bad_bot SetEnvIfNoCaseUser-Agent"^Wget/1.6"bad_bot <Files~"\.(html|pdf|mp3|zip|rar|exe|gif|jpe?g|png|php|jsp)$"> OrderAllow,Deny Allowfromall Denyfromenv=bad_bot </files>