黄色av免费观看_少妇久久久_久久黄色_伊人久久国产_日韩午夜激情_一本一道久久a久久精品综合

您當前的位置主頁 > 網站推廣 > 瀏覽文章

不完美的網站分析數據:數據理想化和訪問者理想化

來源:網站推廣 2012-11-13

快速提升網站銷量,使用365webcall在線客服軟件

一、 技術理想化

每種數據收集方式都有其獨特的技術優勢,但沒有一種收集方式能完美的捕獲到訪問者在網站上的所有動作,每種技術也都會由于自身的局限性導致你看到的數據是并不完美的數據。以計算頁面停留時間為例,下圖是一次訪問的時間記錄:(圖示中時間皆為進入頁面的時刻)

通常計算頁面停留時間的方法為:當前頁面的進入時刻與下一頁面的進入時刻差。由此得知上例中頁面的停留分別如下:

頁面A:5分鐘

頁面B:1分鐘

頁面C:4分鐘

頁面D:?

為什么頁面D的停留時間沒有?沒錯,無論哪種收集方式都無法捕捉到頁面D的準確停留時間,原因很簡單,這些數據收集方式都無法捕捉到訪問者離開的時刻(或者在退出頁停留了半天沒做任何點擊,或者直接關閉了瀏覽器)。所以不同的工具廠商對退出頁的停留時間有不同的定義,有的統一計算為1分鐘,有的干脆認為是0分鐘。

目前主要有下面幾種技術或限制數據的獲取,或混淆現有收集到的數據。

1. 緩存

這里說的緩存不是指物理芯片例如CPU的緩存,而是為了節約網絡資源,提高瀏覽網頁速度建立的瀏覽器緩存或代理服務器緩存。簡單的理解這兩種緩存就是,將曾經訪問過的網頁內容(包括圖片以及cookie文件等)存放在電腦或代理服務器里。當你調用以前閱讀過的頁面時,可以直接調出緩存中的內容,而不需要再次從網站服務器上重新傳送數據。

下圖就是訪問一個網站后本地緩存文件夾中留下的文件記錄:

由于當訪問者通過本地緩存訪問網站時,并不會往網站服務器發送請求,服務器中自然也就不存在這次訪問的Log記錄。也就是說通過Web日志收集到的數據一定會丟失這部分流量。

2. 網絡爬蟲

如果想要講清搜索引擎爬蟲的原理和算法恐怕單開一個章節都不夠,而且也不是這本書關注的內容,所以這里就不再贅述。

下面先給出一條網站服務器Log中的搜索引擎爬蟲記錄:

203.208.60.178 [10/Nov/2011:12:00:00 +0800] “-” “GET /index.php HTTP/1.1″ 200 30000 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +/wangzhanfenxi-shuju-buwanmei

文章編輯: 365webcall網上客服系統(www.365webcall.com)

我的評論

登錄賬號: 密碼: 快速注冊 | 找回密碼

主站蜘蛛池模板: 日本在线免费观看视频 | 一级成人黄色片 | 久久人操| 欧美日韩一区,二区,三区,久久精品 | 在线看国产视频 | 久久精品黄 | 亚洲网站免费 | 国产三级影院 | japanese末成年free| 一本一道久久久a久久久精品91 | 国产午夜精品一区二区三区免费 | 天天看天天摸天天操 | 日韩黄色片在线观看 | 亚洲操比视频 | 日韩午夜一区二区三区 | 在火车上摸两乳爽的大叫 | 91精品国产91久久久久久蜜臀 | 视频一区二区不卡 | 一区二区三区四区高清视频 | 亚洲午夜精选 | 免费一区二区三区 | 久久精品视频在线 | 国内精品国产三级国产a久久 | 国产黄色一级大片 | 亚洲综合色视频在线观看 | 主人在调教室性调教女仆游戏 | 久久精品小短片 | 国产一级性生活视频 | 一级做受大片免费视频 | 国产高清自拍一区 | 久久久麻豆| 日本一区视频在线观看 | 一级成人欧美一区在线观看 | 激情大乳女做爰办公室韩国 | 神秘电影91 | 久久影院yy6080| 国产精品久久久久久久模特 | 欧美亚洲国产成人综合在线 | 999精品国产 | 精品二区在线观看 | 717影院理论午夜伦八戒秦先生 |