說明:如果您有任何疑問或想咨詢其他業(yè)務請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預警
實時把握輿情動態(tài)精準追溯信息源頭
▍數(shù)據(jù)的獲取
01.數(shù)據(jù)來源平臺
多數(shù)企業(yè)都是直接用統(tǒng)計軟件來獲取的,如GA、百度統(tǒng)計、CNZZ、51la等,雖然大體是相同的但是仔細分析下來還是會有細微的差距。估計很多朋友也在GA或者百度、cnzz到底用哪個 來統(tǒng)計數(shù)據(jù)糾結過。如果你的網(wǎng)站上了百度競價,那么百度統(tǒng)計是更好的選擇?,F(xiàn)在統(tǒng)計代碼基本都是異步加載,不用太過擔心速度問題,如果你還糾結,那也可以全部都使用一下。
02.本地保存“即時數(shù)據(jù)”
統(tǒng)計軟件后臺一般會有一些分類數(shù)據(jù),如來路頁面、受訪頁面等,基本不受時間限制,隨時可以的。但是要注意那些需要即時保存的數(shù)據(jù)欄目,舉個例子,CNZZ后臺的“訪問明細”,該欄目只保存近7天的數(shù)據(jù),這意味著如果你一不注意,數(shù)據(jù)有可能找不回來了。所以,這類數(shù)據(jù)建議保存在本地。
?
03.數(shù)據(jù)格式“.xls”
在統(tǒng)計后臺數(shù)據(jù)的過程中,基本都會出現(xiàn)格式選項,CNZZ是.csv和.xls,百度統(tǒng)計是.csv和.pdf。pdf數(shù)據(jù)自帶圖表;csv為純文本數(shù)據(jù)格式;xls為Excel專用,便于數(shù)據(jù)分析。其中.csv文件和.xls下來后,數(shù)據(jù)的長相極其相似。因為csv文件是純文本數(shù)據(jù),并不是數(shù)值,所以不能進行數(shù)據(jù)上的求和,求平均值,只能計數(shù)!如果你不小心用了.csv文件,一定要先處理成數(shù)值,否則后期數(shù)據(jù)分析時會有無法正確統(tǒng)計的情況!
04.多頁數(shù)據(jù)采集及合并
當你需要保存在線數(shù)據(jù)時,需要注意一個小細節(jié),比如CNZZ的“訪問明細”欄,右上角顯示的按鈕是“本頁報表”,而其他欄目的按鈕是“報表”,兩個仔細一對比你發(fā)現(xiàn)了,一看原來只是一頁的數(shù)據(jù),再想的時候,服務器數(shù)據(jù)已經(jīng)過了7天,數(shù)據(jù)不在了…所以小伙伴們一定要注意,千萬不要被坑!
每頁報表,會有一個問題是當你的網(wǎng)站訪問量很大時,訪問明細數(shù)據(jù)每一頁都需要點擊。這個很頭疼。
我目前的解決辦法是使用“火車頭采集器”,模擬人工點擊,每頁數(shù)據(jù);
第二個問題是:自動的數(shù)據(jù)每一張都有表頭/尾,人工合并也會累死??梢允褂肊xcel VBA功能,但我的辦法是使用“慧辦公”插件的合并多表功能,這種有使用限制,需要購買,
大家如果更好的辦法也希望分享出來
▍數(shù)據(jù)清理
01.盡量不對源數(shù)據(jù)做修改
我做數(shù)據(jù)分析有個原則,是“堅決反對對源數(shù)據(jù)進行直接修改”。首先,專業(yè)的統(tǒng)計軟件在設計統(tǒng)計后臺的數(shù)據(jù)時,已做精選,選出的數(shù)據(jù)能夠限度滿足用戶的需求。當源數(shù)據(jù)不符合你的要求時,千萬別在源數(shù)據(jù)中插入行和列,比如要插入日期列,請插入在數(shù)據(jù)表頭或者尾。因為每次保存數(shù)據(jù)時,都是直接從好的表格中粘貼數(shù)據(jù),在源數(shù)據(jù)表中多出任何一行或列都會增加你的操作成本。
也是說,對源數(shù)據(jù)盡量減少人為干預,減少出錯,省心省力。
02.坑貨csv要轉化為數(shù)值
在數(shù)據(jù)獲取部分我提到了關于源數(shù)據(jù)是.csv格式的問題,如果你知道這里有坑不進去是的,但是已經(jīng)進去了,怎么辦?我開始源數(shù)據(jù)一直用csv,因為csv的文件小,速度快,數(shù)據(jù)分析時蒙B了。那么已經(jīng)保存為csv格式的數(shù)據(jù)怎樣變成數(shù)值呢?答案是Excel的分列功能。
1)Excel打開源數(shù)據(jù)表,復制部分數(shù)據(jù)到.txt文本中,觀察源數(shù)據(jù)用的什么符號;
2)選中某列數(shù)據(jù),點擊導航欄“數(shù)據(jù)”—“分列”;
3)下一步,如圖中的數(shù)據(jù)分隔符是“Tab”+“””,那么選擇Tab和其他兩項,繼續(xù)下一步;
4)選擇目標區(qū)域(要復制在哪里),搞定。
▍如何制表
01.報表是你思考結果的展示
很多企業(yè)可能制表人與分析人都不是同一個。要記住報表是要把分析人的思路更簡潔的展示給其他人。所以推薦制表人是分析人本人。不要以浪費時間和辦公軟件不熟悉為由拒絕,熟練掌握辦公軟件,我覺得是運營人的基本素質。
思路的展現(xiàn)邏輯一般是“總分總”,以網(wǎng)站分析說,我的框架是:流量趨勢→來源渠道→渠道1明細→渠道2明細…→來路分析→受訪分析→搜索詞→外鏈。
02.制定表格規(guī)范
制表中切記展示圖表不能亂用,用折線圖表達百分比關系?數(shù)據(jù)對比用折線圖??為數(shù)據(jù)選擇合適的展現(xiàn)圖表類型,比較數(shù)據(jù)間區(qū)別時,用條形圖;表示不同項在總體的占比時,用餅狀圖;反映事物變化時,用折線圖;觀察不同項目長短板時,用雷達圖…還有其他諸如符號使用規(guī)范、配色規(guī)范等,這里不再啰嗦了??傊?,你換位思考一下,別人看你的圖表的時候能不能理解的透徹呢?
03.數(shù)據(jù)分析后一定要有可執(zhí)行建議
把數(shù)據(jù)做成表格不是為了裝逼,讓別人看起來很牛。作為一個專業(yè)人員始終記得“報表只是你思考結果的展示”,重要的是你通過數(shù)據(jù)分析出來了對今后工作有指導性的建議。把報表做的漂亮是一種能力,但是美觀始終流于表面。只有真正有指導性的建議才能長久的打動人。
這個問題很難了,但如果能分析的好,你不僅僅是個專員。
04.透視表,降維打擊
使用Excel做分析的時候,基本上是直接用基本的篩選、公式(sumif、countif、sumproduct)、條件格式之類,雖然操作逐漸變得熟練,速度越來越快??墒窍胂笠幌拢斈阈枰獙Ρ仍磾?shù)據(jù)中兩天某一項數(shù)據(jù)的區(qū)別時,可能需要先加入三列輔助列,然后使用countif函數(shù)對兩列進行計數(shù),第三列使用減法再加上顏色的條件格式。如何對比兩個月的數(shù)據(jù)呢?用sumproduct,多塞幾個條件??
透視表工具早學早好,使用的Excel的“數(shù)據(jù)透視表”功能后,能力會加強太多了,“對比功能”“創(chuàng)建組”功能,分析起來簡直不要更爽!另外,對于Excel的學習,基本功也別落下,對數(shù)據(jù)的基本函數(shù)和條件格式,用好了也能帶你飛。
▍分析要素
01.日記:當天有特殊情況記錄在趨勢表中
一個網(wǎng)站的運營者,每天上班的必做是粗略過一遍昨天的統(tǒng)計數(shù)據(jù)。把每天收集到可能影響到網(wǎng)站數(shù)據(jù)的情況“批注”在趨勢表中,等到周報時進行數(shù)據(jù)對比,會方便很多。包括一些活、EDM等等標注好有利于之后的總結工作。
02.峰值:高峰、低峰都不能放松
在面對圖表分析時,峰值為明顯。但是很多人只分析不好的低峰而忽略高峰,對高峰擅自代入。
面對峰值時,首先要縮小粒度。如觀察8月8日出現(xiàn)低峰,那么再看是在8月8日當天哪幾個小時數(shù)值降低,再分別篩選出這幾個小時的來訪及受訪數(shù)據(jù),逐一分析,找到根源。低峰找出原因,今后避免;高峰,也找出原因,今后重現(xiàn),驗證你找到的原因。
03.對比:約束變量,同軸對比
在上文中提到了“制定表格規(guī)范”,其中對比規(guī)范的核心是要同軸。比如數(shù)據(jù)對比坐標軸不能瞎變,這周記錄的是星期一到星期天,對比的是本周和上周;下周記錄的變成了星期三到星期五,對比的是上半月和下半月。坐標軸一定要按照表格類型來,周報告以周報告為軸,對比的也是本周7天和上周7天的數(shù)據(jù)。有特殊情況需要在周報告中顯示更長的時間段時,應該固定該時間。頻繁更換坐標軸是非常不明智的。
04.經(jīng)驗:記住周期性現(xiàn)象,這是你的寶藏
什么叫周期性現(xiàn)象,比如“每逢節(jié)假日流量下降”、“每逢流量下降”、“每周三9點PV暴增”等等,多次重復并反映在數(shù)據(jù)波動上的情況。
針對平臺運營,記住所有周期現(xiàn)象,這是你今后工作比別人更專業(yè)的經(jīng)驗來源,不需要企業(yè)花費大量試錯,節(jié)省大量人力物力。
05.反常:事出反常必有妖
什么叫反常現(xiàn)象,比如大多網(wǎng)站在中午12-14點間,流量都會因為網(wǎng)民需要休息顯著降低,且PC流量降低,移動流量驟升。但是如果某,或者某一周的12-14點流量全體暴增呢?
反常現(xiàn)象是在周期性現(xiàn)象的異變,當多次出現(xiàn)反?,F(xiàn)象時,你找到原因后要開始重新審視周期性現(xiàn)象是否產(chǎn)生了變化,是否是政策變化;是否是環(huán)境風向變化;是否是平臺玩兒變化等。
▍理論誤區(qū)
01.猜測不代表結論
進行數(shù)據(jù)分析時,先看日記中記錄了哪些行為,再對比數(shù)據(jù)結果看記錄該行為的同時是否產(chǎn)品數(shù)據(jù)波動,如果數(shù)據(jù)波動符合日記中的行為常識,那么可以大膽猜測該項數(shù)據(jù)變化是由該次行為導致。
接著你要做的是通過數(shù)據(jù)驗證它,而不是武斷的認為數(shù)據(jù)波動是這個行為產(chǎn)生的。
比如,公司派同事去路演,路演PPT尾頁留有微信公號的二維碼。結果在數(shù)據(jù)分析時,發(fā)現(xiàn)當天微信新關注數(shù)量暴增。然后運營人員不經(jīng)過驗證直接武斷的把新增用戶的效果歸于路演,甚至得出了要多參加路演的指示??墒窃跀?shù)據(jù)分析時,發(fā)現(xiàn)當天新關注數(shù)的增長來源是“名片分享”而不是“掃描二維碼”,后來一問才知道,是社群組的同事進行了一次小范圍的社群名片互動。
始終要記住“猜測不代表結論”,提出猜測后,要證實它。當出現(xiàn)實在找不到根源的問題時,先暫時放棄,記錄下你的猜測,找機會再驗證它。
02.深入分析,結論可能是假的
剛才提到了“猜測不代表結論”,這里面存在連環(huán)套。因為數(shù)據(jù)分析工作面對著大量數(shù)據(jù),時間一長,人難免會焦躁,特別是老是找不到原因時,很容易得到假結論。
舉個例子,某次分析網(wǎng)站數(shù)據(jù)時,對比發(fā)現(xiàn)有網(wǎng)站的PV暴增許多,縮小粒度后發(fā)現(xiàn)數(shù)據(jù)增幅集中在當天14-17點,然后開始分析“受訪頁面”的訪問次數(shù),一排序,發(fā)現(xiàn)某個欄目PV暴增,一問部門同事才發(fā)現(xiàn)是因為內容運營開了爬蟲,抓取了大量的信息流,提高了PV量。
這時候,如果不細想很容易得出“PV暴增是因為內容組抓取大量內容導致”的表面結論。因為回到問題中,原現(xiàn)象是“14-17點,PV暴增”,現(xiàn)有的表面結論并沒有按照小時粒度去分析,終分析14-17點小時數(shù)據(jù)時,發(fā)現(xiàn)原來是因為這三個小時來了一位新訪客,瀏覽了多篇資訊文章,然后把所有欄目都看了一遍。
所以終PV暴增的原因應該是“新訪客瀏覽整站”和“內容組開爬蟲”共同作用引起的,而非單一項。在實際工作中,人們很容易只是看到了層表象得出結論,時刻記住多深入分析,想想現(xiàn)有的結論是不是到小粒度了,有沒有可能是個陷阱?
▍結語&題外話
01.當你的某項工作長期不見起色,懷疑源頭試試
以數(shù)據(jù)分析來說,分析人員有時候會出現(xiàn)分析來分析去是得不出結論的現(xiàn)象,導致這種現(xiàn)象的原因除了上文提到過的“csv格式”等操作問題時,還有可能是數(shù)據(jù)源本身出現(xiàn)了錯誤。別想著機器一定正確,如CNZZ后臺統(tǒng)計“來源分類”時,四個來源渠道數(shù)量想加出現(xiàn)了不等于總和的情況。這里面有部分來源是后臺統(tǒng)計不到的,所以沒有計入。也會有數(shù)據(jù)表格時,后臺出錯一了張空表,合并時出現(xiàn)大坑。
所以適當?shù)膽岩稍搭^,說不定會有意想不到的發(fā)現(xiàn)。
02.三方平臺不可靠?那自建
剛才提到了統(tǒng)計后臺出錯的一些情況,當后臺出錯的次數(shù)很高,降低了運營者對統(tǒng)計軟件的信任度。一旦對源數(shù)據(jù)的正誤產(chǎn)生了懷疑,工作起來絕不會順心。
既然三方平臺不可靠,有實力讓公司的技術人員自行搭建后臺吧。在技術人員實力過硬的情況下,不僅可靠,而且可擴展性強,分析粒度也更細(如CNZZ不能統(tǒng)計用戶行為路徑),可以完全按照運營人的數(shù)據(jù)要求進行定制,后期為用戶建模時,提供的數(shù)據(jù)支撐。
03.數(shù)據(jù)不會說話,但你要負責
在數(shù)據(jù)分析中,會慢慢得到一些樂趣,次學會用Excel某個函數(shù)的得意、次知道透視表時的興奮、次制作PPT被夸獎時的欣喜…你發(fā)現(xiàn)了很多坑,也學了很多小技巧。會從小白變成大神,能輕易的使用某個小聰明的手段,掩蓋掉真實數(shù)據(jù)的缺點。這些,數(shù)據(jù)永遠不能開口說話,但是你要對自己負責。
本文來源于網(wǎng)絡,歡迎大家一起交流分享
推薦閱讀
競價推廣分析 競價推廣該如何分析數(shù)據(jù) | 文軍營銷競價推廣分析——競價推廣該如何分析數(shù)據(jù) 第一、要知彼。 在競價推廣之前一定要清楚的了解同行的動向,了解同行的優(yōu)勢賣點,了解同行競價推廣的關鍵詞、推廣區(qū)域、創(chuàng)意編寫、展現(xiàn)形式、語句長短的等等方面,做到知彼,這樣才能知道如何讓自己的創(chuàng)意與眾不同; 第二、要知己。 要清楚的了解自己的優(yōu)勢,特別是于同行之間的差距...百度競價數(shù)據(jù)分析 | 文軍營銷百度競價數(shù)據(jù)分析 做數(shù)據(jù)分析要抓住核心的東西“轉化率”,采用:對比、細分、溯源的分析方法,憑借福爾摩斯的聰明才智,一定可以做出完美的數(shù)據(jù)分析。 為近100家大中型企業(yè)提供優(yōu)質搜索引擎營銷服務 為近1000家行業(yè)客戶提供專業(yè)搜索軟件產(chǎn)品 平均節(jié)約約50%的營銷成本 ...
說明:如果您有任何疑問或想咨詢其他業(yè)務請撥打電話 400 685 0732