PowerBI資料視覺化練習題:以MEDIUM後臺數據為例

建置即時數據更新的數位儀錶板失敗紀錄

Patrick Wong
Feb 28, 2021

繼上次兩篇文章《PowerBI資料視覺化初體驗:以澳洲薪資、賦稅、匯率為例》、《Power BI資料視覺化練習題:以澳洲農場打工一年三個月的薪資為例》內文提到自己有個朝資料產業發展的夢,以及分享自己視覺化的成品與過程中所面臨的瓶頸,此處就不再贅言。

會選擇POWER BI進行練習,主要是因為對微軟的辦公室軟體較為熟悉,尤其EXCEL幾乎是各公司的標配與必備軟體,其次則是配合公司業務要求,因此選擇POWERBI當作學習的起點。

這次就以自己經營MEDIUM近兩年來的後臺數據當作基礎,因為錯過可以埋GA的時間點,自己也不知道是否有其他方式抓後臺數據,所以就很土法煉鋼的方式將每一天的數據慢慢KEY進EXCEL,然後再利用中繼資料庫做月流量數據的處理,最後才做數據視覺化。

文章的部分:100篇文章*每篇4項數據=400筆
平台的部分:約630天*3項數據=1890筆
兩者共2290筆資料。
數據量看似不多,但一筆一筆KEY資料其實很累,尤其是下班後還要做這種很文書行政的工作,這樣的前置作業備感煎熬。

前言就說到這,以下就準備進入正題。

數據資料簡介

此次視覺化的練習題資料來源:《經營MEDIUM近兩年,寫百篇文章、粉絲破200人、月流量破萬的MEDIUM生涯》,主要是自己於2020年的12月初,在MEDIUM上達到自己要求的三項KPI:

  1. 寫一百篇文章
  2. 月流量破萬
  3. 追蹤人數過200人

達成KPI的時候剛好接近年底,因此決定數據的收集從2018年3月18日第一篇文章開始,持續到2020年12月31日為止。數據維度的部分根據後台數據可以分成兩部分來說:

  1. MEDIUM整體數據每日的:流量(Views)、閱讀量(Reads)、以及拍手次數(Fans);
  2. 每篇文章整體的:流量(Views)、閱讀量(Reads)、閱讀率(Read Ratio)、以及拍手人數(Fans)

以上數據都是用EXCEL做紀錄,以利後續方便將流量第一名、閱讀率、以及拍手數最高的資料整理出來。

先前的文章《經營MEDIUM近兩年,寫百篇文章、粉絲破200人、月流量破萬的MEDIUM生涯》雖然有說會在做一篇後台數據分析的文章,之後再接續做一篇視覺化的文章,但發現MEDIUM經營的那一篇後面都有提到後台數據的部分,因此就不再另寫一篇文章佔無謂的篇幅。

視覺化展現

先來看整體的視覺化呈現效果,這次分成兩頁呈現(如下圖所示):

第一頁

每日平台數據(上)、每月平台數據(右下)、至2020/12/31整體平台經營數據(左中)、整體平台數據(左下)

第二頁

文章的「總」瀏覽量(Views)、閱讀量(Reads)與閱讀率(Read ratio)

接下來針對各項視覺效果作說明。

平台經營近兩年下來的整體數據

瀏覽量(左上)、閱讀量(左上)、拍手量(左上)、拍手次數(左上)

由於追蹤人數(Followers)在主頁上,不在後台資料的範疇,因此就不列在上頭。

在前一篇文章發表時,內文提到的追蹤人數已來到222人;
在此篇文章撰寫之餘,追蹤人數已來到247人。

每日後臺數據

從第一篇文章開始的「每日」瀏覽量(Views)、閱讀量(Reads)與拍手次數(Fans)

從圖表中可以看到初期流量超低,2019年8月初瀏覽量逐漸增加來到335,之後平台瀏覽量就逐漸上升,而2020/10/29的流量也來到平台經營以來的歷史新高,來到了475。

流量有所成長固然高興,相對的閱讀次數卻仍然保持低點,拍手次數也是少到幾乎看不出變化。

再將每日數據整理成每月數據來看的話:

每月後台數據

每月流量、閱讀量,以及閱讀率變化

將圖表從原先的折線圖轉成折線與群組直條圖來看每個月的經營數據的話,可以發現隨著流量越高,閱讀率從初期最高的68%,跌到2020年12月的時候來到16%,從過去的數據變化初步判定兩者之間成反比。

最後來看整體的各項比率:

個人較常關注的三率

從漏斗圖可以發現閱讀率只有21%,代表每五人僅有一人會去點閱文章;10.7%的閱讀拍手率,意味著看完文章會去拍手的讀者,每10位僅有1位會去作拍手的動作;以最終拍手率來看(瀏覽→閱讀→拍手,自創的名詞),僅有0.3%,表示每100人,僅有不到1人會看完文章後按讚,真的是低到不行啊!

因此,從現有的數據來看,該如何提升閱讀次數以及拍手次數?這兩點是我未來經營平台上,必須面對的重要議題。

每篇文章的後臺數據

文章的「總」瀏覽量(Views)、閱讀量(Reads)與閱讀率(Read ratio)

第二頁的數據呈現的是每篇文章從發佈以來的各自「總」量,可以根據瀏覽量(Views)、閱讀量(Reads)與閱讀率(Read ratio)的不同去作不同的排序變化。

以瀏覽量(Views)來看:

以文章的「總」瀏覽量(Views)高到低排序

以瀏覽量排序來看,可以發現瀏覽量前五名的文章分別為:

  1. 來澳洲墨爾本兩個月的坎坷找工經驗談
  2. 該不該念大學?為什麼要讀大學?大學畢業生給高中生的簡易心得談
  3. 替代役物語-起源:從成功嶺到單位分發的策略規劃與過程
  4. 除了工業工程師,工管系還可以考什麼證照?淺談工業工程與管理系相關的20張證照
  5. 替代役物語:法律真的只保障懂法律的人!那些被當事人忽略的法律權利

以閱讀量(Read)來看:

以文章的「總」閱讀量(Reads)高到低排序

以閱讀量排序來看,可以發現閱讀量前五名的文章分別為:

  1. 來澳洲墨爾本兩個月的坎坷找工經驗談
  2. 替代役物語-起源:從成功嶺到單位分發的策略規劃與過程
  3. 該不該念大學?為什麼要讀大學?大學畢業生給高中生的簡易心得談
  4. 培養可以「帶著走」的專業能力
  5. 除了工業工程師,工管系還可以考什麼證照?淺談工業工程與管理系相關的20張證照

以閱讀率(Read ratio)來看:

以文章的閱讀率(Read ratio)高到低排序

在前篇文章有提到官方後台閱讀率有失準的問題,以及流量較小的文章,閱讀率變化波動較大,因此在此不再列出閱讀率排名。

整個視覺化效果的探討篇章,到此告一段落,最後再來看一次成果:

整體平台相關數據變化
各篇文章的瀏覽量、閱讀量與閱讀率

過程中所遇到的瓶頸

同樣的文章標題導致數據異常

眼尖的讀者可能會發現文章的閱讀率(Read ratio)中,有一篇文章的閱讀率來到了154%。一開始我也覺得很奇怪,因為一般來說閱讀量只會在0~100%的區間,不可能會超過100%,會超過表示這絕對是異常值。

異常的閱讀率154%

後來發現是我有兩篇標題完全一樣的文章:《懂得做人比做事重要》&《懂得做人比做事重要》(上述兩篇網址不同),一篇是之前接系刊編輯時,跟系友訪談的文章;另一篇則是自己在訪談後受益良多,再另外改寫編輯的。

知道問題後不修改,也是為了紀錄曾發生過這樣的錯誤(我就懶),提醒之後要注意有同樣內容的資料要避開,才不會跟這次一樣發生所有數值加在一起的情況發生。

對,沒錯,是兩篇文章的瀏覽量、閱讀量與閱讀率全部相加,並非只有閱讀率而已,會只注意到閱讀率是單純因為那根太明顯了!所以看似只有一項數據錯誤,其實是三項數據全異常。

簡易的函數計算練習

之前是直接算在同一個資料表格上,會導致圖表失真。因此這次除了刻意保留原始資料不動,另外開一個新的工作表格作相對複雜的計算跟函數運用外,這次的百分比計算、以及數值格式的轉換,都全在POWER BI執行。

圖表呈現的數值格式

先前兩次的視覺化練習,圖表上面的數值單位,數值太大時會跑出國字,像是「千」、「百萬」等級的單位等,數值呈現方式非常不直觀。

這次確實解決數字與國字的數值單位混用問題,直接透過X軸與Y軸的內容裏頭改變顯示格式,就能解決不一致的問題,也間接解決X軸與Y軸標題無法隱藏的問題點。

因此這次整體視覺不像之前一樣國語與數字大量參雜,破壞整體美感。

日期上下階的完整串聯

這次資料都是每一天都有紀錄,因此有連續性,在時間上有完整的年、月、日的上下階,也讓圖表能作不同的時間軸去呈現。

每日的圖表,可以改用每月、每年的方式去呈現:

上為每日紀錄、下圖為每月紀錄

每月的圖表也能改用每年、歷年每月來看:

上為每月紀錄、中為每年紀錄、下為歷年每月

尚未解決的問題點

即時數據更新的視覺化建立

原先這次想作出一個當數據從EXCEL更新時,像是每天都會更新一筆每日的數據,POWER BI這邊也會馬上連動作更新,而非人工將資料重新匯入POWER BI一次。

若能將數據即時更新的部分完善,我就能在2020/12/31的數據基礎上,每日更新數據,就不需要再重新拉資料進POWER BI重跑,不然人工KEY資料後再匯入POWER BI,每更新一筆就要重拉一次資料,太麻煩了。

也因此,在這次的視覺化呈現上沒有什麼新意,因為時間主要都投入在鑽研即時化的部分。只是現階段暫時苦無解方,無奈之下,決定先告一段落,催生這篇文章的產生,趁記憶猶新的時候趕緊記錄下來。

內建的函數功能不會使用

簡單的加減乘除還可以,但較複雜或是困難的雙變數、統計相關的運用就完全不行。

明明都是中文字,但有些說明真是有看沒有懂呢!看來我的慧根還有待萌芽…。

漏斗圖標示的處理

無用的100%與無意義的1.4%

前面在介紹的時候,將最尾巴的1.4%給截圖掉,因此看不出問題。全圖來看,會發現最上面的100%與最下面的1.4%暫時找不到可以隱藏的部分。

上述三率不需要刻意用100%與1.4%,也導致多了無用數據,閱讀拍手率跟流量拍手率並非連貫的計算方式,因此個人也不需要漏斗終端的數據,因為兩者數據其實沒因果關係,只是剛好顯示的方式符合漏斗狀,所以採用而已。

結語

從這次資料視覺化來看,該如何提升閱讀次數以及拍手次數?這兩點是我未來經營平台上,必須面對的重要議題。

主要想做的主題沒完成,視覺化呈現的方式沒什麼大變化,成果跟上次相比,只能給自己打個30分的水準(可能還太高)。不知道看的人有何觀感(歡迎讀者留下自己的看法)?不過對自己而言,算是跨出一大步。

想建立一個數據能夠即時更新的視覺化儀錶板,對現在的我來說是

剛出新手村的勇者想挑戰最終大魔王。

還是腳踏實地,一步一步慢慢學、慢慢來吧。預計未來想針對自己現有的資料庫做視覺化的練習題:

  1. 澳洲生活支出:澳洲的消費水準高不高?我在澳洲生活一年七個月的花費總結與分析
  2. 墨爾本地圖資訊收入:我有個賣地圖資訊的副業:經營數據不藏私,兩年來的地圖資訊經營報告大公開(延伸閱讀:利用資訊差創造資訊價值,我在澳洲建立人生第一份被動收入

最後,有關個人的數據文,我就放在文末,有興趣的人歡迎去爬文看看。

延伸閱讀

  1. 經營MEDIUM近兩年,寫百篇文章、粉絲破200人、月流量破萬的MEDIUM生涯
  2. PowerBI資料視覺化初體驗:以澳洲薪資、賦稅、匯率為例
  3. Power BI資料視覺化練習題:以澳洲農場打工一年三個月的薪資為例
  4. 關於澳洲百萬年薪的神話,讓我用薪資單告訴你,我在農場一年賺多少錢
  5. 我在澳洲農場第二個半年的薪資結構分析
  6. 如何讓採番茄的績效獎金收益最大化?單打獨鬥與抱團作戰的選擇
  7. 在澳洲賺第一桶金必須要知道的三件事:賺了時薪、賦了高稅、賠了匯差
  8. 澳洲打工度假,該不該買車代步?讓過來人用自駕一年五個月的交通成本來告訴你
  9. 紐西蘭自駕北島14、南島32天的行程規劃與預算花費
  10. 澳洲的消費水準高不高?我在澳洲生活一年七個月的花費總結與分析
  11. 如何成為一個採果快手快快手:掌握核心觀念與時間背後代表的意涵
  12. 基本薪資與績效獎金,專注何者才划算?
  13. 我採果,不代表我賺得多
  14. 利用資訊差創造資訊價值,我在澳洲建立人生第一份被動收入
  15. 從採番茄看績效指標對員工行為的影響

--

--

Patrick Wong
Patrick Wong

Written by Patrick Wong

燃燒著工管魂的企管人,「進步,從不說明天開始」/要求自己人生不設限,並尊重社會多樣性/興趣是廣泛閱讀,夢想是當Serial Entrepreneur

No responses yet