日志文件一直都是網絡治理人員在檢查故障、排除網絡錯誤時,查找“病源”的有利工具。
而Web日志記錄由于數量大,分析難度高,令人忘而卻步。
其實巧妙剖析Web日志記錄,能夠讓網絡治理人員領會到網絡治理的樂趣所在。
你了解公司站點的訪問情況嗎?假如僅僅是簡單地統計一下訪問量,說明你還未真正利用Web站點為企業服務。事實上,對站點訪問情況進行具體分析,尤其是Web日志分析,能幫助企業更好地作出商務決策。簡單地,對制造商而言,可決定某類產品是否有繼續生產的必要;或對站點進行針對性改造完善,使之更具吸引力,并讓客戶和企業內部用戶能實現高效訪問。為達到此目的,可手工進行Web日志分析,或采用商用Web分析工具進行自動分析,還可采用外包服務方式。
對網絡主管來說,大量的Web日志記錄信息難于治理,對日志數據的分析“破解”更是一項浩大的工程;面對堆積如山的日志數據,有的主管甚至無從下手。甚至在使用Web日志分析軟件的用戶都有此感覺。一般的Web服務器都配置有站點訪問日志記錄,且大多數在采用商業軟件來分析日志文件數據,數據分析周期(每周或天天)進行,但很少有企業在真正基于分析工具得出的結論基礎上進行站點改進。那么,針對站點訪問的分析活動意義倒底何在呢?
Web分析要實現的功能
Web日志文件事實上是一些分離的“碎片”,日志分析軟件的功能就是將這些碎片集合起來,從中剖析出有用信息,提高網站訪問效率,進而為商務決策提供支撐服務。
例如,一個中等規模的電子產品批發商對其Web站點通信進行了數月分析,發現用戶對安全產品愛好很濃,如智能卡。于是公司針對其提供的安全產品發起了一場營銷活動,兩月后公司收益明顯提升,以前銷售一直不好的一些分公司業績也開始名列前茅。
簡單的日志分析方法是,運用telnet命令登錄到Web服務器實時查看日志文件更新情況,這種方法查看的數據量大,但只能進行最基本的分析。通過觀察抵達服務器的通信,能確定用戶是否碰到了訪問錯誤,是內部Web站點訪問還是欲進入搜索引擎。假如用戶指向搜索引擎,則可查看搜索類型以及要害字,以幫助企業建立相關的內容治理方案,進而制定相應的行銷戰略。
但這里有個問題,用戶不可能一直守在機器旁查看日志信息更新情況。因而對通信進行深層分析的最好辦法是采用專門的日志分析軟件。
幾乎所有大中型企業都構建有動態Web站點,能基于數據庫生成各類站點信息,這就給用戶訪問行為分析帶來了難度。因為所有站點URL都是類似的,站點分析工具有可能誤將它們視為同一訪問,如URL:www.mydomain.com/PRodUCts.aspx?productid=20與www.mydomain.com/products.aspx?productid=21,大多數日志分析軟件將它們視為同一頁面,而忽略了附加參數,即要訪問的產品編號。因而Web日志分析軟件應具備參數識別能力,能依據完整的訪問字符串分析站點訪問行為。
例如,NetIQ的WeBTrends分析工具在其高級治理功能選項中提供“URL參數分析”功能,能對特定頁面內容進行分析。在用戶提交頁面名(products.aspx)和參數名(productid)后,工具能基于參數分析報告得出具體分析結果,如對特定產品頁面的瀏覽訪問次數。治理人員可據此獲取更多有用信息,如站點中被訪問最多或最少的產品,并運用轉換文件將信息直觀表達出來。 路徑與參數分析同等重要
WebTrends并不是將參數作為整個路徑的一部分來分析看待,參數拾取分析僅在參數分析報告形成中發生。但這種參數分析方法在登錄、退出或路徑分析報告中相當有用。
通過對用戶或客戶端訪問Web站點的路徑進行分析會發現,訪問者不一定是從主頁進入站點,在搜尋到所需信息后也不一定從主頁退出。事實上,用戶有可能經常繞過你認為重要的站點信息,包括主頁中的核心內容。這就需要對站點內容進行調整,真正迎合用戶的“口味”。例如,可采用啟發式的即問即答服務方式,試探用戶的訪問取向。
大多數日志分析軟件都能提供一定類型的路徑分析報告。有一種“5%規則”:假如對Web站點特定頁面(如某產品頁面)的訪問量超過了整個站點訪問量的5%,則應將該頁面視為與主頁同等的訪問優先級;據此可將其設定為趣味性動態內容、廣告或專門鏈接。5%規則同樣可運用于退出頁面,以此保證用戶訪問Web站點時間更長,吸引他們購買更多產品或搜尋更多信息。
事實是,大多數訪問者在站點呆的時間也就幾分鐘,而且很少購買產品。需要對退出頁面進行分析,以決定訪問者從哪個頁面離開Web站點。假如不是從預想的目標頁面退出,如僅列出產品類別而沒有任何具體產品的頁面,這時可通過改變站點架構或頁面內容重新定位用戶訪問。另外就是,導致訪問者退出頁面的原因是多方面的,有可能是退出頁面的內容過長或過短,或出現令訪問者厭煩的內容,或出現鏈接中斷,抑或是圖片加載時間過長,因而要確定訪問者退出特定頁面的真正原因是件費時費力的事。一種簡單方法是,通過變更內容來查看用戶的訪問行為。
WebTrends將參數分析與路徑分析分離對待,因而要基于登錄和退出頁面得到有用結果,需要在報告中查看完整的URL(包括后續質詢串)。在路徑分析中(包括登錄和退出頁面報告),需要更為詳盡的信息幫助進行治理。可以在每次出現訂購或取消某產品時創建客戶代碼,并寫入數據庫,然后編寫一程序來詳盡報告數據庫中的哪些產品經常被購買或更換。要實現這類復雜的日志分析,Datanautics提供的G2平臺比較在行,它具備數據挖掘功能,能將日志文件數據與數據庫信息進行關聯。
錯誤分析
當用戶瀏覽站點時,往往會發生這樣或那樣的錯誤提示,通常是“錯誤404文件未找到”。
導致404錯誤有三種可能:一是用戶本身不在想要的Web站點主頁面(如在搜索引擎結果頁面),而點擊了本不存在的頁面鏈接;二是同一Web站點內鏈接錯誤;第三是用戶輸入URL錯誤。
很明顯,對Web站點內或指向外部站點的鏈接進行有效治理相當重要。通常的日志分析軟件不但能顯示引發404錯誤的原因,而且能告訴主管訪問者在試圖進入哪個頁面以及訪問哪個文件(內部或外部的)時發生錯誤。
引發外部404錯誤的原因通常是Web站點進行了重新設計,如更新了Web架構,增加了訪問地址錄或改變了文件命名方式。可能有數千個外部站點鏈接到同一頁面而該頁面早已不存在,這跟存儲變更一樣,不一定通知客戶存儲位置已改變到何處。沒有任何辦法來自動治理外部404錯誤,但可設法減少或消除這類鏈接指向。例如,運用日志分析軟件,用戶能透過404錯誤發現來自外部Web站點的鏈接,并給這類Web站點主管發去電子郵件,告知鏈接更新信息。大多數情況下,鏈接會得到即時修復,客戶能實現正常訪問;更為重要的是,已鏈接到本站點的用戶能不中斷地從一個Web站點跳到另一站點。
新聞熱點
疑難解答