0532-88983785 0532-68613670
青島網(wǎng)站建設|青島網(wǎng)站優(yōu)化|青島微信開發(fā)|青島網(wǎng)站制作

Apache下網(wǎng)站日志里面顯示百度蜘蛛(Baiduspider)等的方法

時間:2016-06-23 10:10 來源:http://m.inorcal.com 作者:admin 點擊:3796次

  網(wǎng)站的優(yōu)化工作很重要的一個環(huán)節(jié)就是要讓搜索引擎蜘蛛到網(wǎng)站上來抓取內(nèi)容,如果搜索引擎蜘蛛都不來網(wǎng)站,那網(wǎng)站的內(nèi)容再多在豐富也是沒有用的。
  整個互聯(lián)網(wǎng)形如一張網(wǎng),搜索引擎的抓取程序就是通過這些一個一個的連接來抓取頁面內(nèi)容的,所以搜索引擎被形象的叫做蜘蛛或網(wǎng)絡爬蟲。網(wǎng)絡爬蟲是搜索引擎的一個自動的抓取頁面的程序。搜索引擎蜘蛛通過跟蹤連接訪問頁面。獲得頁面HTML代碼存入數(shù)據(jù)庫。爬行和抓取是搜索引擎工作的第一步,也就是數(shù)據(jù)收集的任務。然后就是預處理以及根據(jù)算法排名。
  對于站長來說,網(wǎng)站的第一步就是解決收錄問題,我們每天都在更新,可有時就是不收錄。我們要想得到收錄和蜘蛛的青睞,你就要懂得蜘蛛的爬行原理和規(guī)律。要學習和研究蜘蛛爬行規(guī)律,分析網(wǎng)站的訪問日志是重要的一項工作。下面我們來介紹如何查看網(wǎng)站的訪問日志。

針對WDCP面板 設置Apache日志記錄蜘蛛爬行
1、首頁,你要在 “站點編輯” 里面把 "開啟訪問日志 " 這個選項打勾
2、配置vhost 里面對應站點的 conf 文件( /www/wdlinux/apache/conf/vhost)
把 CustomLog "/www/web_logs/你的域名_access_log" common 這一行的? common 修改成 combined
也就是修改成 CustomLog "/www/web_logs/你的域名_access_log" combined
修改完后保存一下。
3、請確認CustomLog沒有被#號注釋掉,把 /www/wdlinux/apache/conf/httpd.conf? 這個文件也改一下
把 #CustomLog "logs/access_log" combined? 這一句前面的 # 去掉,然后再重啟web服務

4、重新啟動web服務,測試一下效果
好了,以上操作應該是可以實現(xiàn)效果了,希望大家都可以操作成功

特別提醒,針對WDCP面板,如果在站點設置里面修改了其他設置,保存之后站點對應的conf配置文件會自動覆蓋掉。或者點擊了“更新所有站 點配置”,對應的conf配置文件也會覆蓋掉你手動添加的代碼。到時候默認的設置還會是:CustomLog "/www/web_logs/你的域名_access_log" common,然后又得去手動改一下。我找到一個完美解決的辦法,其他地方都不要動,也不用去修改站點的conf配置文件。
直接修改apache默認的httpd.conf配置文件。打開/www/wdlinux/apache/conf/httpd.conf。找到:
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common

把common和combined交換一下就行了,最終的代碼:
LogFormat "%h %l %u %t \"%r\" %>s %b" combined
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" common

上傳后重啟一下web服務就可以了。
原理就是在“站點編輯” 里面 "開啟訪問日志"后,默認是添加的CustomLog "/www/web_logs/你的域名_access_log" common 這段代碼,生效的就是httpd.conf里面common的配置,改一下默認的common的配置就OK了。

針對單個主機的配置方案 設置Apache日志記錄蜘蛛爬行
1、打開httpd.conf文件找到以下部分:LogFormat
“%h %l %u %t \”%r\” %>s %b \”%{Referer}i\” \”%{User-Agent}i\”" combined
LogFormat
“%h %l %u %t \”%r\” %>s %b” common
LogFormat
“%{Referer}i -> %U” referer
LogFormat
“%{User-agent}i” agent
具體有關(guān)LogFormat的用法請參照:
2、接著我們繼續(xù)向下移動,找到虛擬主機配置段,也就是VirtualHost段,這個是由你自己來配置的。本站的虛擬主機的日志文件是這樣設置的:如果你想記錄百度蜘蛛的訪問全稱,就按色部分設置:
CustomLog
/var/html/faq/logs/linux520-access.log combined
如果不想記錄百度蜘蛛的頭部分,則如下設置:
CustomLog
/var/html/faq/logs/linux520-access.log common
按照以上設置一下,看看你的日志文件是否發(fā)生變化了。


  迅優(yōu)傳媒是一家專注于網(wǎng)站優(yōu)化、網(wǎng)站建設、網(wǎng)站設計網(wǎng)站制作、微信開發(fā)的互聯(lián)網(wǎng)科技公司。我們的SEO和SEM工程師針對客戶的網(wǎng)站及行業(yè)現(xiàn)狀等進行深度分析,幫助很多客戶提升了網(wǎng)站排名并完成了互聯(lián)網(wǎng)全平臺的推廣,為客戶節(jié)省了大筆費用,同時提升了品牌形象、提高了轉(zhuǎn)化率。
(責任編輯:admin)
網(wǎng)站優(yōu)化SEO

0532-88983785 / 0532-68613670

我要優(yōu)化網(wǎng)站