Archive

Posts Tagged ‘log’

Tips: 清理web DocRoot目录

June 24th, 2009 3 comments

在公司WebServer的DocuementRoot下,有一个目录,里面有近1G的各种文件合计五六千个,都是历年来的广告创意文件及各种临时项目性的文件,严重影响了DocumentRoot的整洁,对SVN, 目录备份和恢复等很多工作,一直想清理,可是谁都不知道哪些文件有用哪些可以清理. 于是

1 所有新的广告创意文件,全部移动到另外一台服务器上去,webserver不需要支持PHP,用lighttpd就好.性能好了,而且也更好配置缓存策略;

2 用Outlook日程,设置一个定期约会,在新站上线3个月之后,提醒自己去解决这个问题;

3 3个月之后,下载CDN前端近一周的access.log日志;

4 cat access.log | grep 所有200 OK的访问记录,把所有该目录的抓出来,sort , uniq 然后在 sort -k1 -nr以后,可以看到集中在200多个文件的访问,而前几个文件的访问次数就占了绝大多数,这样心理就有数了.可以把不用的文件都挪出DocRoot,然后暂时留着这些文件在慢慢处理;

5 把包含所有文件全路径的.log文件 cat use.log |?xargs tar cvf a.tar 这样的目的是包含路径信息;

6 mv 原来的那个目录到DocRoot之外;

7 把刚才打包的tar释放到原来的位置

8 该目录的尺寸 800M –> 36M, ?文件数 6K –> 200

9 设置一个7天的日程安排,7天之后看看 404的报告是否有还需要挪进来的,同时也安排工程师去根据前面日志的refer看看那些程序需要修改,逐渐的把引用该目录的页面都改到引用那台媒体服务器上去.

10 搞定.

好好学习,努力工作,搞定雅思和女朋友,然后找个能自由上google的地方去生活.

?

/ads/house_ads/468_60_house_08.gif
Categories: 技术圈 Tags: , , , ,