有个应用程序不是很稳定,又暂时找到具体问题,只知道出现错误时日志文件会反映出来. 该应用定时更新日志目录,有两个日志文件:fromclient.log 记录接收请求,fromserver.log记录接收服务端返回.
出现问题时一般是fromclient.log日志在更新,但是fromserver.log就停止了. 灵机一动,何不用python写个监控日志的程序,发现程序异常就自动重启,这样不至于严重影响客户使用. 多出时间来彻底解决问题.
于是就有了下面的代码: #!/bin/env Python # -*- coding: cp936 -*- import glob,os,time,stat,sys
deadflag = 60 #判断进程死掉的秒数
def GetFileTime(filename): return os.stat(filename)[stat.ST_CTIME]
def main():
path = glob.glob("../log/PROXY*")[-1]
clifile = path + "/" + "mt.log" svrfile = path + "/" + "fromserver.log"
clitime = GetFileTime(clifile) svrtime = GetFileTime(svrfile)
print clifile,time.localtime(clitime) print svrfile,time.localtime(svrtime) if abs(svrtime-clitime) > deadflag: print "time is over! will restart!" os.system("sh /home/esm/bin/restart_tcpproxy.sh") return
if __name__ == "__main__": main()

|