发新帖
发新帖

周口新闻网

百度取消新闻源的消息一出来,很多人就在讨论,这是不是要把那些时效性差的传统媒体往死了逼?我倒是觉得,既然存在就是合理了,这些媒体残喘了多年依然活着,恐怕还能继续活一段时间,再说也不是非要把它全部铲除殆尽才算一个时代的结束,既然大家早就公认那个时代结束了,百度取消新闻源对他们的影响就不具有代表意义了,直接翻篇吧。  第四步:一张完美整洁的日志就导入进来了,这样再看是不是很舒服很清晰呢  第五步:把一些不需要的删除,只需保留cs-uri-stemURI资源、c-ip客户端IP地址、cs(User-Agent)用户代理、sc-status协议状态这4项就可以了  如下图所示,一目了然!  网站日志英文注释:  date日期  time时间  s-sitename服务名  s-ip服务器IP地址  cs-method方法  cs-uri-stemURI资源  cs-uri-queryURI查询  s-port服务器端口  cs-username用户名  c-ip客户端IP地址  cs(User-Agent)用户代理sc-status协议状态  200表示成功  301永久重定向  403表示没有权限  404表示找不到该页面  500内部服务器错误  503服务器超时  sc-substatus协议子状态  sc-win32-statusWin32状态  sc-bytes发送的字节数  cs-bytes接收的字节数  time-taken所用时间  网站日志分析  以下图为例  通过分析:一款俄罗斯的蜘蛛通过IP为141.8.142.145地址爬取了robots.txt这个文件,抓取成功,返回200正常。

主题数
8767
帖子数
43723
用户数
167909
在线
81