Archive

Archive for June 24th, 2009

Tips: 清理web DocRoot目录

June 24th, 2009 3 comments

在公司WebServer的DocuementRoot下,有一个目录,里面有近1G的各种文件合计五六千个,都是历年来的广告创意文件及各种临时项目性的文件,严重影响了DocumentRoot的整洁,对SVN, 目录备份和恢复等很多工作,一直想清理,可是谁都不知道哪些文件有用哪些可以清理. 于是

1 所有新的广告创意文件,全部移动到另外一台服务器上去,webserver不需要支持PHP,用lighttpd就好.性能好了,而且也更好配置缓存策略;

2 用Outlook日程,设置一个定期约会,在新站上线3个月之后,提醒自己去解决这个问题;

3 3个月之后,下载CDN前端近一周的access.log日志;

4 cat access.log | grep 所有200 OK的访问记录,把所有该目录的抓出来,sort , uniq 然后在 sort -k1 -nr以后,可以看到集中在200多个文件的访问,而前几个文件的访问次数就占了绝大多数,这样心理就有数了.可以把不用的文件都挪出DocRoot,然后暂时留着这些文件在慢慢处理;

5 把包含所有文件全路径的.log文件 cat use.log |?xargs tar cvf a.tar 这样的目的是包含路径信息;

6 mv 原来的那个目录到DocRoot之外;

7 把刚才打包的tar释放到原来的位置

8 该目录的尺寸 800M –> 36M, ?文件数 6K –> 200

9 设置一个7天的日程安排,7天之后看看 404的报告是否有还需要挪进来的,同时也安排工程师去根据前面日志的refer看看那些程序需要修改,逐渐的把引用该目录的页面都改到引用那台媒体服务器上去.

10 搞定.

好好学习,努力工作,搞定雅思和女朋友,然后找个能自由上google的地方去生活.

?

/ads/house_ads/468_60_house_08.gif
Categories: 技术圈 Tags: , , , ,

悼念Google

June 24th, 2009 3 comments

果不其然,经过一周的造势和准备,Google被封,唯一还能访问的应该就是www.g.cn这个阉割版的Google了.

除了搜索以外,我们失去了什么?

gmail,邮件和联系人在这里;

docs,服务器的一些共享的配置文档;

google Analytics,服务器的访问监控和分析. 曾经公司有人强力建议用Google Analytics取代我们自己的数据分析,被我苦口婆心的劝阻,原因是我们无法把公司最核心的数据分析放在一个第三方公司的免费服务上,因为一旦服务中断,数据不连续,就会是无法弥补的遗憾..我却没想到出问题的不是这个第三方的公司,而是…

calander等等,我用得不多,但是很多人再用的各种google的工具

还有什么?

没什么了.没失去什么.我赶紧背雅思去吧.希望能赶趟..

立此存照,我们悼念的又何尝是Google而已?

Categories: 不是我不明白 Tags: