18
2019 富邦人壽管理博碩士論文獎 網際網路消費者之網站停留時長預測-深度學習方法 之應用 Prediction of consumer's website browsing duration - application of deep learning methods 摘要 對於電商來說,從商品類別思考著網頁該如何規劃重點排列是電商行銷在內容建置 上相當重要的核心關鍵,一個帶著目的去網站的用戶,若在頁面停留時間上很長時,說 明了該網頁的內容吸引用戶。透過分析點選網頁之行為,進而預測並提高網站的每頁停 留時間指標,是業者一直在思考和研究的議題。過去對於捕捉用戶的瀏覽行為都是採用 機器學習的方式,但由於消費者的瀏覽行為是動態相依的,導致傳統機器學習的效果不 彰。因此,本研究運用深度學習技術,發展一套智慧型用戶線上行為預測模式。本研究 將用戶線上行為研究分成兩個階段:第一階段為運用集群分析分析用戶過往的瀏覽習慣, 捕捉用戶的行為輪廓;第二階段為利用深度學習為分析方法,針對先前分群的結果分別 建模,進行未來用戶在網頁上的停留時長的預測,以供未來電子商務網頁的編排或策略 上的擬定。 關鍵字:電子商務、網站瀏覽行為、集群分析、深度學習應用

網際網路消費者之網站停留時長預測 深度學習方法 之應用 … · 對於電商來說,從商品類別思考著網頁該如何規劃重點排列是電商行銷在內容建置

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

2019 富邦人壽管理博碩士論文獎

網際網路消費者之網站停留時長預測-深度學習方法

之應用

Prediction of consumer's website browsing duration

- application of deep learning methods

摘要

對於電商來說,從商品類別思考著網頁該如何規劃重點排列是電商行銷在內容建置

上相當重要的核心關鍵,一個帶著目的去網站的用戶,若在頁面停留時間上很長時,說

明了該網頁的內容吸引用戶。透過分析點選網頁之行為,進而預測並提高網站的每頁停

留時間指標,是業者一直在思考和研究的議題。過去對於捕捉用戶的瀏覽行為都是採用

機器學習的方式,但由於消費者的瀏覽行為是動態相依的,導致傳統機器學習的效果不

彰。因此,本研究運用深度學習技術,發展一套智慧型用戶線上行為預測模式。本研究

將用戶線上行為研究分成兩個階段:第一階段為運用集群分析分析用戶過往的瀏覽習慣,

捕捉用戶的行為輪廓;第二階段為利用深度學習為分析方法,針對先前分群的結果分別

建模,進行未來用戶在網頁上的停留時長的預測,以供未來電子商務網頁的編排或策略

上的擬定。

關鍵字:電子商務、網站瀏覽行為、集群分析、深度學習應用

2019 富邦人壽管理博碩士論文獎

1

壹、前言

隨著資訊科技的進步與電子商務的蓬勃發展,電子商務的線上交易已逐漸取代傳統

的消費模式,消費者規模與線上交易量也呈現爆炸性的成長。根據 2017 年全球零售電

子商務銷售報告的統計數據顯示,全球電子商務之銷售額高達 2.29兆美元;我國電子商

務營業額則為 2.212 億元,網購比率稱霸亞洲第一且市場規模逐年成長。而在電子商務

平台層出疊見的世代中,究竟要如何才能在群雄當中脫穎而出、擄獲消費者的青睞,是

一件至關重要的議題。事實上,各國電商平台在面臨國際競爭對手節節進逼的情況下,

皆已嘗試從各種不同的角度(例如了解用戶行為、增加行動用戶體驗、提升精準流量、縮

短供應時辰等)發展經營策略以有效提升自我的競爭優勢。其中,如何精確分析用戶網頁

瀏覽行為與偏好,並藉此改善用戶體驗提高電商收益,又是近年來電子商務數據挖掘領

域中極為熱門的研究議題之一。Park(2012)曾表示線上瀏覽行為是消費者在線衝動購買

之預測的重要因素;Alfian(2019)認為消費者的瀏覽路徑能觀察出最常瀏覽的頁面、購買

的商品及網頁停留時間等資訊。結合這些數據可以幫助零售業者去識別且滿足消費者的

需求,並客製化地向消費者展示推薦的產品、暢銷之產品和最近瀏覽過的產品。因此藉

由消費者之線上瀏覽行為,可用於行銷策略的擬定及産品提供,促使商業效益最大化。

在分析網頁瀏覽行為與偏好的議題當中,由於廣告商大多在努力爭取消費者對其廣

告產品的興趣與專注,倘若用戶願意在頁面上多停留一些時間,就算消費者尚未購買也

會增添他們未來的購買機會,因此如何準確預測用戶在網站及網頁上的停留時間,進而

增加用戶在網站或頁面上的停留是一個行動時代甚具商業價值的新行銷目標。而由於代

表用戶在線行為的點擊流數據,可以直接觀察到用戶的瀏覽行為,所以被視為最能描述

消費者特徵的重要資訊之一,因此現今已有許多國際企業及文獻已投入在其中的研究。

Moe(2004)曾利用集群分析來分析各種網頁瀏覽行為,比如購物者在每個頁面上花

了多少時間,訪問了多少商品或品牌;而 Senecal (2005)則以問卷調查的方法探討用戶在

選擇商品時的購物行為 ( 如決策時間、瀏覽的頁面等 ) ; Yeo(2016) 提出

Browsing2purchase(B2P)模型來聚合用戶瀏覽歷史中所提取的預測特徵,並發現客戶在

網站上的瀏覽行為是預測上線購物的重要依據。由於商品瀏覽之點擊流數據是由用戶觀

看之商品所累積而來的,因此分析消費者的瀏覽資料自然可以了解消費者偏好及商品屬

性的影響。事實上,消費者瀏覽網頁的行為,除了受到商品屬性特徵(商品的種類)的影

響外,也受到消費者瀏覽行為特徵(每日瀏覽之時段、及日期)的影響。此外,根據上述

的研究結果,我們不難發現預測用戶之瀏覽行為大多會先以用戶過往之瀏覽行為特徵為

主要考量,待瀏覽行為模式建構後,再進一步對用戶之未來觀看偏好行為進行預測。

過去針對用戶瀏覽資料應用一般統計模型或機械學習來進行預測的研究相當多,但

是這些硏究大多將模式中的影響因素視爲獨立且不相互干擾的因子。但是用戶瀏覽行為

特徵並不是相互獨立的,而是有可能相互干擾並帶有時序性的,這種時序相依性(Timing

dependence)將使一般統計或機器學習模型難以捕捉或學習其行為特徵,並使模式的建構

過程產生混淆與偏誤,因此如何針對具有非獨立性及時序性的客戶瀏覽美妝資料建模,

並正確預測出消費者行為實乃是實務作業上的一大挑戰。

2019 富邦人壽管理博碩士論文獎

2

長短期記憶神經網路(Long Short-Term Memory,LSTM) 是一種具有記憶性的時間

遞歸神經網路,由於獨特的結構設計,LSTM 適合於處理和預測時間序列中的間隔和延

遲事件。而在用戶瀏覽網頁的過程裡,雖然每一個頁面商品都是由不同的時間所觀看的,

不過由於用戶之瀏覽行為具有持續性的特性,同一位用戶所觀看的頁面內容會有其相依

性、相似性以及順序性。若我們選擇忽略用戶瀏覽行為間的順序關係,而直接使用傳統

統計估計或機器學習分析方法來建模並預測用戶行為,預測結果可能會與實際上的結果

大相逕庭。因此在本研究中,我們將用戶不同時間點的瀏覽行為整合在一個模式中,並

透過把瀏覽行為進行編碼與標準化,使長短期神經網路在訓練時能達到良好的成效,最

終準確地預測用戶後續之瀏覽行為。

貳、文獻探討

本章共分為兩個部分,第一個部分會先概述網頁停留時間與其重要性,並探討影響

消費者頁面停留時間相關因子之文獻,接著回顧了消費者頁面瀏覽停留時間的相關文獻,

並從中探討過去預測頁面停留時間方法之優劣與限制;第二部分則整理長短期記憶模型

在消費者行為上的應用。

一、線上行為相關文獻

本節會先介紹網頁停留時間背後的含義與其重要性;除了介紹影響網頁停留時

間的相關因子,我們也將回顧消費者頁面瀏覽停留時間預測之相關文獻。

(一) 網頁停留時間之重要性

網頁停留時間又可稱之為”黏性”(Bhat et al.,2002),對於消費者之網頁停留時

間,Bucklin and Sismeiro(2003)曾針對電子商務用戶於網頁停留之時長進行研究,並

發現較長的頁面持續停留時間有助於保持用戶對網站的興趣,並可提供給用戶更多

的時間來考慮和完成網路購物。而 Moe and Fader (2004)表明,用戶興趣的增強有助

於產生重複的回訪,從而帶來更大的長期銷售。根據 Demers et al.(2001)的研究則表

示,瀏覽網站頁面的時間越長,股票收益將越高。雖然頁面停留時間可能不會在因

果關係上驅動股價,但一些投資者將網站瀏覽時長作為未來收益的指標。由上述內

容可知,消費者於網頁之停留時間是一個行動時代的新行銷指標。

(二) 影響網頁停留時間之因素

對於消費者的網頁停留時長,Danaher et al.(2006)曾考察了用戶、頁面點選及其

交互特徵如何影響網頁瀏覽行為,並發現可能影響網頁瀏覽時間的因素包含了用戶

的人口統變、網頁點選類型和網頁點選內容等。Moe et al.(2004)、Bucklin et al.(2002)

以及 Park et al.(2004)接曾提出,有不少研究利用點擊流數據來探索用戶的行為特徵,

包含用戶的瀏覽行為。換言之,用戶於瀏覽網頁的點選行為,可以視為其自身偏好

與興趣的展現,由上述文獻可知,用戶於瀏覽網頁的點選內容與選擇網頁的類型,

為影響用戶網頁停留時長的重要因子。

(三) 網頁瀏覽行為

網路用戶在線行為的紀錄被稱為點擊流數據,這些數據涵蓋了用戶的網頁瀏覽

路徑,點擊流數據正成為研究人員和業者了解個人行為最有用的資源之一(Bucklin

et al.,2009)。個人用戶的網頁瀏覽行爲可以通過其在每次瀏覽會話中與網頁交互時

2019 富邦人壽管理博碩士論文獎

3

所瀏覽的網頁序列和瀏覽時間來代表。早期的研究證明,在線顧客通過收集有關產

品、品牌特徵和價格的訊息來計劃他們的在線購買(Kau et al., 2003);Rohm et al.(2004)

表示,線上的瀏覽行為即在收集與比較商品特徵的過程中形成。Marchionini(1989)

指出瀏覽行為是仔細考慮過而非隨機的,原因基於有一個搜尋某物的顯著理由。

Park et al.(2004)曾針對跨網頁的用戶瀏覽行為進行研究,並提出一個多變量的定時

模型,並用此模型來解釋從一個網頁到另一個網頁之瀏覽行為的關聯。由上述研究

我們可以發現,藉由網頁瀏覽行為可以充分地了解消費者的個人行為,而且網頁瀏

覽行為是會相互影響並具有時序性的。

(四) 網頁停留時間之預測

Bucklin et al.(2003)利用 type II tobit model 來捕捉用戶在使用網站期間瀏覽每個

頁面的時間長度,並發現重複訪問會減少頁面的瀏覽傾向,但不會減少頁面的瀏覽

時間;Wang et al.(2016)採用因子分解機(FM)模型,預測放置廣告的頁面深度停留時

間;Liu et al.(2010)曾從頁面級特徵預測停留時間分布的可行性。經由上述研究,我

們可以發現網頁駐留時間的精準建模並不簡單,由於網路頁面上的停留時間取決於

許多因素。此外,過去的研究往往忽略了用戶之點選行為之間並非完全獨立,又或

者傳統的機器學習沒有辦法有效地學習具時間相依性與遞移性的瀏覽行為。因此,

本研究欲使用深度學習,進行用戶網頁停留時長之預測。

二、深度學習相關文獻

深度學習(Deep Learning)是一種以人工神經網路為架構,對資料進行表徵學習

的演算法,本節將會介紹深度學習的一些應用並透過文獻加以探討。

(一) 深度學習之優勢

理論結果表明,為了學習抽象的複雜函數,可能需要深層的體系結構。深層結

構是由多非線性操作組成的,比如在具有許多隱藏層的神經網路(Bengio,2009)。

現代搜尋引擎流行常使用邏輯回歸(LR)和增強決策樹等機器學習方法來預測網頁

內容中的用戶活動,然而神經網路比 LR 更有優勢,因為他們能捕捉輸入特徵之間

的非線性關係,而且神經網路的"深層"架構具有更強的建模能力(Vieira, 2015);深度

學習可經過多層過濾,並藉由過濾模型有效吸收訊號,且模擬推薦系統數百個特徵

之間非線性相互作用(Covington et al.,2016)。綜觀上述文獻,建立深層的神經網路架

構,可以處理雜訊高的數據,還能整合看似不相關的數據來源並解釋數據中非線性

的關係。

(二) 長短期神經網路

學者 Hochreiter and Schmidhuber 在 1997 年提出了一個適合預處理和預測時間

序列中間隔和延遲相對較長之新的遞歸網路結構-長短期記憶(LSTM)。LSTM 比傳

統的遞歸神經網路(RNN)更受歡迎,因為它觀察到梯度隨時間的反向傳播不斷導致

漸漸消失或爆炸,LSTM 已經可以處理梯度消失的問題(Ravindran and T,2018)。隨

著深度學習發展日益精進,LSTM已有不少文獻被發表,(Gers and Schmidhuber,2001)

測試了 LSTM 在上下文無關語言(CFL)的處理並發現其優越的性能,且其學習算法

比時間反向傳播(BPTT)、RNN等算法更為有效;2013年 Graves 等學者將 LSTM 運

2019 富邦人壽管理博碩士論文獎

4

用在混合語音的識別上,並發現有不錯的效果;除了語音識別,Wang et al. (2016)也

在自然語言中的情緒分類中使用 LSTM 建模。

近年來,LSTM 也延伸到應用在行銷領域中,透過分析消費者的歷史點選行為

去預測未來的瀏覽行為或購買行為或是近年來最熱門的應用之一。Wu et al.(2015)

等學者將 LSTM 用於點擊模式對電子商務購買行為之神經建模,因為在實際場景

中,點擊本身並不是相互獨立的,此研究提出一個基於長-短期記憶(LSTM)的雙向

遞迴神經網路來訓練點擊事件,使原始點擊訊息可以是點擊標示的任何特徵,並包

含時間訊息;Sakar et al.( 2018)使用長短時記憶(LSTM)代替 HMM 來處理點擊流數

據。這是基於發現隨著序列中樣本數量的增加,LSTM 產生的模型比 HMM具有更

高的學習能力和歸納能力。

Tønnessen et al.(2018)表示一個標準的 RNN能夠學習時間模式,但是隨著需要

捕獲的時間依賴關係的增加,它的難度也在增加,LSTM 單元透過其固有的記憶功

能,克服了這一個問題,允許在任一時間間隔內回憶值;Jo et al.(2018)等學者也曾

表示 LSTM 在序列建模和時間序列分析任務中越來越受歡迎,基於遞歸神經網路

(RNN)的體系結構,卻發現在大量的時間處理任務表現優於傳統的 RNN。

綜和上述的研究中可以發現,長短期記憶神經網路在針對包含時間遞移性的序

列型資料去預測未來行為的應用上得到了不錯的學習效果,且不斷廣泛拓展到各種

領域中。

(三) 網頁瀏覽行為

網路用戶在線行為的紀錄被稱為點擊流數據,這些數據涵蓋了用戶的網頁瀏覽

路徑,點擊流數據正成為研究人員和業者了解個人行為最有用的資源之一(Bucklin

et al.,2009)。個人用戶的網頁瀏覽行爲可以通過其在每次瀏覽會話中與網頁交互時

所瀏覽的網頁序列和瀏覽時間來代表。早期的研究證明,在線顧客通過收集有關產

品、品牌特徵和價格的訊息來計劃他們的在線購買(Kau et al., 2003);Rohm et al.(2004)

表示,線上的瀏覽行為即在收集與比較商品特徵的過程中形成。Marchionini(1989)

指出瀏覽行為是仔細考慮過而非隨機的,原因基於有一個搜尋某物的顯著理由。

Park et al.(2004)曾針對跨網頁的用戶瀏覽行為進行研究,並提出一個多變量的定時

模型,並用此模型來解釋從一個網頁到另一個網頁之瀏覽行為的關聯。由上述研究

我們可以發現,藉由網頁瀏覽行為可以充分地了解消費者的個人行為,而且網頁瀏

覽行為是會相互影響並具有時序性的。

參、研究方法

一、線上行為相關文獻

2019 富邦人壽管理博碩士論文獎

5

圖 1 分析架構

步驟一:本研究資料為威朋(Vpon)大數據公司所提供的每位用戶電子商務平台網頁

瀏覽紀錄及瀏覽商品屬性等數據。

步驟二:資料處理主要分為兩個部分,第一個部分為資料的合併與再分類,第二個

部分則為瀏覽行為的編碼。在資料合併的部分,我們將所有的瀏覽行為根據用戶之 ID進

行分割,並依照瀏覽頁面的日期進行合併且排序,以便長短期記憶神經網路模型之建構。

針對瀏覽商品的部分,本研究則依照產品類別將商品概分為六種類型,而在瀏覽行為編

碼的部分,本研究依照瀏覽商品的頻率編碼,並將商品名稱以編碼的結果替換。

步驟三:根據每位用戶之瀏覽時間與各種瀏覽商品類型之累積次數,進行集群分析。

步驟四:解讀集群分析結果,了解各群用戶的瀏覽行為差異。

步驟五:根據深度學習模型結構,整理用戶瀏覽行為資料,並進行長短期記憶神經

網絡模型之建構與用戶瀏覽頁面停留時間之預測。

步驟六:解讀長短期記憶神經網路模型之分析結果。

二、DBSCAN分群法

DBSCAN(Density-based Spatial Clustering of Applications with Noise(DBSCAN)為

Martin Ester於 1996年所提出,是一種以空間資料分布密度為基礎的分群分析方法,其

主要目的是透過密度可達關係,找到密度相連對象的最大集合。DBSCAN 需要兩個參數

進行分群,分別為半徑(Eps)和密度門檻值(Minpts)。首先,任意選擇一個沒有類別的核

心對象作為種子,找到所有這個核心對象能夠密度可達之樣本集合,即為一個聚類群集。

接著繼續選擇另一個沒有類別的核心對象去尋找密度可達的樣本集合,這樣就得到另一

個聚類群集。重複運行直到所有核心對象都有類別為止,以達到分群的最後結果,如圖

2所示。

深度學習模型 模型結果

解讀

用戶之瀏覽行為分析

(集群分析)

群 1

群 2

群 n

分群結果

解讀

電子商務平台之

商品瀏覽紀錄

2019 富邦人壽管理博碩士論文獎

6

圖 2 密度導向式分群法示意圖

三、長短期記憶類神經網路

長短期記憶模型(long short-term memory)是一種特殊的 Recurrent Neural Network

模型,它主要是為了解決 RNN模型中梯度彌散(vanishing gradient problem)的問題而

被提出的。在傳統的 RNN中,訓練演算法使用的是(Backpropagation through time,BPTT),

當時間較長時,需回傳的殘差值會呈現指數下降的趨勢,並導致網路權重更新緩慢,無

法體現出 RNN 的長期記憶效果。為了解決這樣的問題,LSTM 模型特別提出了一個儲

存單元的想法,以儲存資料中的長短期記憶。

Xingjian et al.(2015)表示長短期記憶模型(LSTM)是 RNNs 最成功的系統結構之一,

LSTM 介紹了一種取代傳統計算單位的人工神經元存儲單元,這些存儲單元能夠有效地

連結記憶,並及時輸入遠程,隨著時間的推移這種存在於隱藏層的構造適合動態的掌握

數據結構預測能力。因此近年來長短期記憶模型已被廣泛的用來處理具有時序遞移性的

問題。

LSTM 和一般 RNN 不同之處在於 LSTM 內部神經元為一個記憶細胞(Cell state),

記憶細胞能將過去時間點的資訊保存並且連接至當前任務,而 LSTM 細胞中包含輸入

閘(Input gate)、遺忘閘(Forget gate)及輸出閘(Output gate),三個閘門的公式,如同式子(1)

到(3)所示,這些閘門存在的目的在於讓機器自動學習,篩選需要之輸入及輸出資訊,並

在適當的時候遺忘過去隱藏層的資訊,以達到控制模型訓練時梯度在此的收斂性。

其中 LSTM 的輸入閘、遺忘閘皆為一個 sigmoid 層做非線性與線性的轉換,透過

觀察上個時間點之隱藏層資訊 h_(t-1)和輸入 x_t,並對記憶細胞 c_(t-1)中的每個元素輸

出一個 0 至 1 之間的數,1 表示完全保留訊息;0 表示完全捨棄訊息,至於輸出閘部

分,和輸入、遺忘閘相似,為一個 sigmoid 層決定當前的資訊是否要輸出,不同的地方

在於輸出閘亦考慮了長期記憶 c_t 的部分,如式(3),通常使用雙曲正切函數(tanh),數值

將落於[-1, 1]之間,-1 表示移除長期記憶。

而 c_t 之所以稱為長期記憶,主要是因為 c_t 在訓練過程中只會進行元素篩選加上

輸入閘帶來的資訊,如式(4)及式(5),換句話說,c_(t-1)和 c_t 之間,對比一般 RNN 之

隱藏層變化相對緩慢,因此可以保留較長遠的記憶;而 m_(t-1)和 m_t 之間則與一般 RNN

之隱藏層相似,稱之為短期記憶。

2019 富邦人壽管理博碩士論文獎

7

𝑖𝑡 = 𝜎(𝑊𝑖𝑥𝑡 + 𝑈𝑖ℎ𝑡−1) (1)

𝑓𝑡 = 𝜎(𝑊𝑓𝑥𝑡 + 𝑈𝑓ℎ𝑡−1) (2)

𝑜𝑡 = 𝜎(𝑊𝑜𝑥𝑡 + 𝑈𝑜ℎ𝑡−1) (3)

�̃�𝑡 = tanh(𝑊𝑐𝑥𝑡 + 𝑈𝑐ℎ𝑡−1) (4)

𝑐𝑡 = 𝑓𝑡 ∙ 𝑐𝑡−1 + 𝑖𝑡 ∙ 𝑐�̃� (5)

𝑚𝑡 = 𝑜𝑡 ∙ tanh(𝑐𝑡) (6)

圖 3 長短期記憶內部結構圖

出處:Greff et al.(2017)

肆、研究結果

一、資料描述

本研究使用「威朋大數據公司(Vpon)」所提供之美妝電商平台顧客交易數據來

進行解讀分析,其中所採用的資料區間為 2015 年 11 月 01 日至 2016 年 6 月 30 日

合計 8個月。原始交易資料可拆解為為用戶行為部分與瀏覽之商品這兩部分,用戶

之行為狀態包含 item_view(瀏覽商品 )、 add_to_cart(將商品放入購物車 )與

checkout(結帳)這三種狀態,原始交易資料格式整理如下:

表 1 用戶原始瀏覽資料(行為部分)

用戶 ID 登入之日期

時間

登入裝置 用戶之行

為狀態

購買商

品數量

1 2015/12/22

12:01:21 AM

Mozilla/5.0 (Windows NT

10.0;

WOW64)AppleWebKit/537.36

item_view 0

2019 富邦人壽管理博碩士論文獎

8

(KHTML.like Gecko)

Chrome/47.0.2526.106

Safari/537.36

1 2015/12/22

12:01:40 AM

Mozilla/5.0 (Windows NT

10.0;

WOW64)AppleWebKit/537.36

(KHTML.like Gecko)

Chrome/47.0.2526.106

Safari/537.36

add_to_cart

0

1 2015/12/22

12:01:44 AM

Mozilla/5.0 (Windows NT

10.0;

WOW64)AppleWebKit/537.36

(KHTML.like Gecko)

Chrome/47.0.2526.106

Safari/537.36

item_view 0

1 2015/12/22

12:03:46 AM

Mozilla/5.0 (Windows NT

10.0;

WOW64)AppleWebKit/537.36

(KHTML.like Gecko)

Chrome/47.0.2526.106

Safari/537.36

checkout 0

表 2 用戶原始瀏覽資料(商品部分)

商品 ID 商品名稱 商品價格

AA1254 保濕組 3520

AA1256 淨化保養組 2530

AA1256 淨化保養組 2530

AA1256 淨化保養組 2530

AK1235 美容棒 1280

將表 1與表 2 結合起來即可得知用戶於什麼時間點,觀看、挑選或購買了什麼

商品。由於本研究主要探討的為消費者一連串瀏覽商品的序列行為,所以將重點擺

在「item_view」這個狀態與這個狀態所相互對應的商品項目。

本研究參考 Danaher et al.(2006)、Moe et al.(2004)及 Bucklin et al.(2002)的做法,

運用瀏覽者網頁點選之產品類型及產品屬性進行網站使用者輪廓描述(分群)及網站

停留時長的預測。其中,由於網站平台所銷售的商品超過百種,我們先根據各產品

的屬性將其概分為臉部保養、化妝品、美體美髮、醫美、保健、及日用品等六大類。

此外,有關產品價格部分,由於原始數據分布相當廣泛(最小值為 300;最大值為

10300;平均值為 1145),我們根據其分布情形概分為三種級別(0 至 3433 為低價位;

3433至 6866為中價位;6866至 10299為高價位)。

2019 富邦人壽管理博碩士論文獎

9

二、集群分析結果

本研究以集群分析探討不同用戶族群於交易平台消費之偏好習慣,因此需要先

計算各用戶的網頁瀏覽行為,本研究利用原始資料,分別計算瀏覽行為的變數:「用

戶瀏覽(六種)商品類型的累積次數」、「用戶瀏覽商品價位的累積次數」、「用戶在網

頁的行為狀態(三種)」與「用戶停留於網頁的總時長」,並存放於「網頁瀏覽行為資

料庫」,其實際資料格式如表 3 所示,之後便以網頁瀏覽行為資料庫中的瀏覽行為

變數為集群分析的變數。

表 3用戶瀏覽行為資料庫(累積次數)

ID

(秒

數)

1 0 68 0 0 0 0 92 0 0 68 24 0 2858

2 4 3 12 0 0 1 26 0 0 20 6 0 653

3 2 24 0 0 0 0 46 0 0 26 11 9 2586

4 0 0 0 0 3 0 6 0 0 3 1 2 320

5 4 15 3 0 0 1 23 1 0 23 1 0 3333

6 0 10 0 0 0 0 10 0 0 10 0 0 430

7 0 5 12 0 0 2 19 0 0 19 0 0 1756

8 0 2 0 0 0 0 4 0 0 2 1 1 164

根據分群的結果,本研究發現用戶多數偏好瀏覽價位偏低,且產品類別為化妝

品的產品,業者可以考慮多引進一些物美價廉的化妝品類型的產品去吸引消費者,

此外,由於用戶多數的當前狀態為「觀看產品」,因此業者可以在頁面旁投放促銷類

型的廣告,誘導用戶產生下單或結帳的衝動。

表 4 用戶瀏覽行為變數之群中心

價位

觀看

時長

1

3.06 3.25 1.13 0.02 0.14 0.38 11.06 0.42 0.02 7.99 1.61 1.9 2308.84

集2.69 3.53 1.22 0.02 0.15 0.37 10.85 0.42 0.01 7.98 1.54 1.75 2561.84

2019 富邦人壽管理博碩士論文獎

10

2

3

2.92 3.43 1.11 0.02 0.12 0.37 11.00 0.40 0.01 7.96 1.61 1.85 2546.11

4

2.9 3.58 1.31 0.02 0.11 0.38 11.30 0.39 0.01 8.31 1.67 1.73 2773.66

三、深度模型之模型分析架構與結果

(一) 資料預處理

Danaher et al.(2006)曾考察用戶的頁面點選是如何影響網頁瀏覽行為,進而發現

其關聯性,在進入本研究的分析方法之前,為了將商品點選行為導入分析模型中,

以達到提升模型的訓練效果,本研究首先將過去瀏覽頁面過少之用戶篩選掉,並將

101 種商品進行文字編碼的轉換,以便之後神經網路訓練分析使用,本研究以一個

用戶的瀏覽行為做為樣本,而編碼結果整理如下表所示:

表 5 商品編碼結果(部分)

商品名稱 面膜 精華液 保濕組 輕便隨行組 保養全系列

編碼結果 20 12 18 52 60

由於 LSTM 模型的輸入數據為一個序列,預測模型的輸入端必須為 3個維度,

分別為資料總筆數、觀察的時間步長與特徵變數,時間步長又稱之為時間窗格,時

間步長的意義代表一次要輸入幾個觀察值讓模型去學習,考量到用戶實際的點選商

品行為與解釋上的合理性,因此時間步長不宜設太短或太長,時間步長太短的話模

型會導致訓練不易,應用或解釋上也不合理,若時間步長太長則會有實作上的不便

與限制等問題,綜合上述,本研究將時間步長設為 10;另外,由於本研究強調的是

輸入與輸入間的關聯性,輸入 10次的點選行為與對應的預測目標值Y為一筆資料,

並利用一次平移一個時間窗格,動態地捕捉用戶點選行為;接著,為了提升模型的

穩健度,本研究將用戶的偏好價位與先前分成六大種類的商品類別分別加入整理好

的資料中,但由於 LSTM 獨特的輸入結構與期望模型能學習到用戶動態的點選行

為,本研究將六種商品的變數以累加的方式呈現,而用戶在網頁上的「剩餘停留時

長」為本研究的目標預測變數。以先前的用戶為範例,假設用戶 ID 為 1 的消費者

總共瀏覽了 30個商品,一個時間窗格所包含的資訊量為 10次的瀏覽行為,而對應

到的硬便數為網頁停留的剩餘時長(如圖 4 所示),最後,LSTM 的輸入可整理如圖

5所示。

2019 富邦人壽管理博碩士論文獎

11

圖 4 用戶瀏覽行為範例(部分)

圖 5 LSTM 動態輸入之變數示意圖(部分)

(二) 戶瀏覽時長預測模型之架構與流程

本研究所建構的預測模型為一層輸入層、一層 LSTM 神經網路層、一層全連接

層與一層輸出層的多對一 LSTM 模型。模型架構整理如圖 6所示。

2019 富邦人壽管理博碩士論文獎

12

圖 6 LSTM 神經網路架構圖

模型的輸入以 10個特徵變數,一次 10 筆資料的方式進行訓練與修正,第二層

的 LSTM 神經元個數設為 500個,接著以一個神經層做完全連接,最後以一個輸出

層去做預測結果的輸出;至於訓練參數的設定,本研究將批量大小(Batch size)設為

25,訓練期數(Epochs)設為 350,代表訓練樣本以每 25筆作為一個批量,重複訓練

350 次;另外,由於本研究的目標預測變數為數值類型的變數,因此本研究將損失

函數設為均方誤差(MSE),修正模型參數與變數權重的優化器則以 Adam 為考量。

本篇論文中,切訓練資料與測試資料的方法與過往直接做資料分割的方法有所

不同,由於在訓練過程中,發現模型雖然可以透過學習前面部分(70%)的訓練資料,

捕捉到後面(30%)用戶之停留時長的「趨勢」,但卻無法精準地預測用戶的停留時長。

模型訓練結果表現不好的原因,可歸咎於模型在訓練資料的時候,沒有一個完整的

用戶行為可供模型學習,因此本研究針對用戶 ID 採用隨機抽取的方式,將隨機抽

取用戶 ID中的 70%當作訓練 ID,剩餘 30%的用戶 ID當作測試 ID;另外,針對測

試 ID中點選行為的部分,由於點選行為具有序列關係,因此針對一個用戶 ID的點

選行為不能採用隨機抽取的方式,而必須是讓點選行為維持連貫性的切割方式。

綜合上述,訓練模型時,本研究將訓練資料中的一個用戶 ID 之完整點選行為

與測試資料 ID中 70%的點選行為當作一組訓練資料,實際的測試資料為測試 ID中

後 30%的行為。訓練資料與測試資料的切割,可以整理如圖 7所示。

2019 富邦人壽管理博碩士論文獎

13

圖 7 資料分割示意圖

(三) 分析結果與討論

表 6為調整模型參數的訓練結果,由結果可看出長短期神經網路所建構的模型

在捕捉用戶動態的點選行為時,有不錯的成效。

表 6 LSTM 參數調整分析結果表

E p o c h

MSE

250 350 450

Ba

tc

h S

ize

群集 1

15 0.0028 0.0023 0.0020

0.0218 0.0141 0.0103

25 0.0059 0.0033 0.0023

0.0330 0.0135 0.0216

35 0.0005 0.0040 0.0019

0.0249 0.0276 0.0221

群集 2

15 0.0031 0.0028 0.0014

0.0122 0.0128 0.0186

25 0.0039 0.0022 0.0017

0.0123 0.0161 0.0141

35 0.0024 0.0022 0.0017

0.0143 0.0203 0.0201

群集 3

15 0.0097 0.0048 0.0027

0.0229 0.0297 0.0229

25 0.0066 0.0049 0.0022

0.0180 0.0206 0.0208

35 0.0082 0.0042 0.0036

0.0171 0.0137 0.0188

群集 4

15 0.0035 0.0027 0.0023

0.0271 0.0366 0.0302

25 0.0037 0.0137 0.0025

0.0256 0.0289 0.0160

35 0.0049 0.0031 0.0028

2019 富邦人壽管理博碩士論文獎

14

0.0261 0.0353 0.0297

表 6為群集 1訓練模型時,損失函數的走勢

表 7 群集 1參數調整-損失函數走勢圖

Epoch

250 350 450

Ba

tc

h S

ize

15

25

35

由上述群集的損失函數走勢圖可知,並非將批量大小或訓練期數增加,即可達

到損失函數最小之最佳解,有時候模型在訓練時會產生過度擬合或陷入局部最佳解

等問題。

(四) 機器學習方法模型比較

本研究欲透過比較與計算普通的機器學習方法以及深度學習方法之間的均方

誤差(MSE),來探討兩者之間的差異。本節共選擇三種演算法,分別為多層感知機

(Multilayer perceptron,MLP)、分類與迴歸樹演算法 (Classification and regression

tree,CART)以及支援向量網路(Support Vector Regression)來建構用戶瀏覽時長預測

模型。由於機器學習方法的輸入需要是一維的,因此本研究將先前 LSTM 三維的輸

入展開為一對一的型態,以供模型進行監督式的學習。將原來的資料展開後,一共

有 100項的瀏覽行為解釋變數,以原先的頁面剩餘停留時長當作應變數,將原始資

料分割為 70%的訓練資料與 30%的測試資料進行訓練根據上述模型比較方法的結

果,可以發現 SVR 的綜合表現優於其餘兩個模型的表現,而原因可歸咎於 SVR 擅

長處理高維度且非線性的資料。最終,本研究將經過調整參數後,表現較好的 LSTM

結果與各演算的預測結果整理於表 4-17中,進行綜合比較與探討。

表 8 預測結果綜合比較圖

M S E

LSTM MLP CART SVR

2019 富邦人壽管理博碩士論文獎

15

群集 1 0.0103 5.2801 5.7622 3.7378

群集 2 0.0123 5.3075 5.4792 4.1511

群集 3 0.0137 5.9346 6.4821 4.5643

群集 4 0.0160 7.7984 7.6518 5.5514

透過表 8 可發現雖然 SVR 的表現優於神經網路 MLP,但當神經網路將簡單的

架構,改為具有「深度」的架構,並且搭配具有特殊記憶構造的 LSTM 神經元,這

樣的模型是有辦法捕捉到用戶複雜的點選行為,並進行精準的預測。

伍、結論與建議

本研究之目的在於提出一個全新的用戶瀏覽行為捕捉方法,解決現行網頁配置與精

準行銷的問題,此方法嘗試藉由深度學習模型,捕捉用戶動態的線上點選行為之間的關

聯性,並依模型學習的成果去預測用戶未來的瀏覽時長。相較於過去學者的訓練方法,

深度學習能夠更有效的捕捉消費者的點選路徑,此外本研究所提出的方法更符合於現實

的運算需求,能夠即時預測用戶的線上行為,提升電子商務平台的服務品質。本研究可

以提出以下幾點貢獻:

一、電商用戶線上行為預測:本研究將分析 Vpon 資料的流程包成一個程式,只要有用

戶上限瀏覽網頁的資料,經過此程式即可即時的預測用戶的停留時長,電商業者亦

可藉由此分析結果,進行網頁重點重新編成,或進行即時的廣告投放。

二、機器學習與深度學習模型之比較:比較的機器學習方法中,以支援向量回歸演算法

的表現最好,多層感知機的表現次之,分類與回歸數的表現最差。不過上述之演算

法,皆沒有長短期神經網路的表現佳。

肆、參考文獻

Alfian, G., Ijaz, M. F., Syafrudin, M., Syaekhoni, M. A., Fitriyani, N. L., & Rhee, J. (2019).

Customer behavior analysis using real-time data processing. Asia Pacific Journal of

Marketing and Logistics. doi:10.1108/apjml-03-2018-0088

Bengio, Y. (2009). Learning Deep Architectures for AI. Foundations and Trends® in Machine

Learning, 2(1), 1–127. doi:10.1561/2200000006

Bhat, S., Bevans, M., & Sengupta, S. (2002). Measuring Users’ Web Activity to Evaluate and

Enhance Advertising Effectiveness. Journal of Advertising, 31(3), 97–106.

doi:10.1080/00913367.2002.10673679

Bucklin, R. E., & Sismeiro, C. (2003). A Model of Web Site Browsing Behavior Estimated on

Clickstream Data. Journal of Marketing Research, 40(3), 249–267.

doi:10.1509/jmkr.40.3.249.19241

Bucklin, R. E., & Sismeiro, C. (2009). Click Here for Internet Insight: Advances in Clickstream

Data Analysis in Marketing. Journal of Interactive Marketing, 23(1), 35–48.

doi:10.1016/j.intmar.2008.10.004

2019 富邦人壽管理博碩士論文獎

16

Bucklin, Randolph E., James M. Lattin, Asim Ansari, Sunil Gupta, David Bell, Eloise Coupey,

John D. C. Little, Carl Mela, Alan Montgomery, Joel Steckel. 2002. Choice and the

Internet: From clickstream to research stream. Marketing Lett. 13(3) 245–258.

Covington, P., Adams, J., & Sargin, E. (2016). Deep Neural Networks for YouTube

Recommendations. Proceedings of the 10th ACM Conference on Recommender Systems

- RecSys ’16. doi:10.1145/2959100.2959190

Danaher, P. J., Mullarkey, G. W., & Essegaier, S. (2006). Factors Affecting Web Site Visit

Duration: A Cross-Domain Analysis. Journal of Marketing Research, 43(2), 182–194.

doi:10.1509/jmkr.43.2.182

Demers, Elizabeth and Baruch Lev (2001), “A Rude Awakening: Internet Shakeout in 2000,”

Review of Accounting Studies, 6 (August), 331–59.

Gers, F. A., & Schmidhuber, E. (2001). LSTM recurrent networks learn simple context-free and

context-sensitive languages. IEEE Transactions on Neural Networks, 12(6), 1333–1340.

doi:10.1109/72.963769

Graves, A., Jaitly, N., & Mohamed, A. (2013). Hybrid speech recognition with Deep

Bidirectional LSTM. 2013 IEEE Workshop on Automatic Speech Recognition and

Understanding. doi:10.1109/asru.2013.6707742

Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8),

1735–1780. doi:10.1162/neco.1997.9.8.1735

Jo, Y., Maki, K., & Tomar, G. (2018). Time Series Analysis of Clickstream Logs from Online

Courses. arXiv preprint arXiv:1809.04177.

Liu, C., White, R. W., & Dumais, S. (2010). Understanding web browsing behaviors through

Weibull analysis of dwell time. Proceeding of the 33rd International ACM SIGIR

Conference on Research and Development in Information Retrieval - SIGIR ’10.

doi:10.1145/1835449.1835513

Marchionini, G.. "Information-seeking Strategies of Novices Using A Full-text Electronic

Encyclopedia", Journal of the American Society for Information Science, 40(1),

1989,pp.54-66.

Moe, W. W., & Fader, P. S. (2004). Capturing evolving visit behavior in clickstream data.

Journal of Interactive Marketing, 18(1), 5–19. doi:10.1002/dir.10074

Moe, Wendy W., Peter S. Fader. 2004. Dynamic conversion behavior at e-commerce sites.

Management Sci. 50(3) 326–335.

N, C. T., & Ravindran, B. (2018). A neural attention based approach for clickstream mining.

Proceedings of the ACM India Joint International Conference on Data Science and

Management of Data - CoDS-COMAD ’18. doi:10.1145/3152494.3152505

Park, E.J., Kim, E.Y., Funches, V.M. and Foxx, W. (2012), “Apparel product attributes, web

browsing, and e-impulse buying on shopping websites”, Journal of Business Research, Vol.

65 No. 11, pp. 1583–1589.

Park, Y.-H., & Fader, P. S. (2004). Modeling Browsing Behavior at Multiple Websites.

Marketing Science, 23(3), 280–303. doi:10.1287/mksc.1040.0050

Rohm, A. J., & Swaminathan, V. (2004). A typology of online shoppers based on shopping

motivations. Journal of Business Research, 57(7), 748–757. doi:10.1016/s0148-

2019 富邦人壽管理博碩士論文獎

17

2963(02)00351-x

Sakar, C. O., Polat, S. O., Katircioglu, M., & Kastro, Y. (2018). Real-time prediction of online

shoppers’ purchasing intention using multilayer perceptron and LSTM recurrent neural

networks. Neural Computing and Applications. doi:10.1007/s00521-018-3523-0

Senecal, S., Kalczynski, P. J., & Nantel, J. (2005). Consumers’ decision-making process and

their online shopping behavior: a clickstream analysis. Journal of Business Research,

58(11), 1599–1608. doi:10.1016/j.jbusres.2004.06.003

Strand-Amundsen, R. J., Tronstad, C., Reims, H. M., Reinholt, F. P., Hogetveit, J. O., &

Tønnessen, T. I. (2018). Machine learning for intraoperative prediction of viability in

ischemic small intestine. Physiological Measurement. doi:10.1088/1361-6579/aae0ea

Vieira, A. (2015). Predicting online user behaviour using deep learning algorithms. arXiv

preprint arXiv:1511.06247.

Wang, C., Kalra, A., Borcea, C., & Chen, Y. (2016, October). Webpage depth-level dwell time

prediction. In Proceedings of the 25th ACM International on Conference on Information

and Knowledge Management (pp. 1937-1940). ACM.

Wang, Y., Huang, M., & Zhao, L. (2016). Attention-based LSTM for aspect-level sentiment

classification. In Proceedings of the 2016 conference on empirical methods in natural

language processing (pp. 606-615).

Wu, Z., Tan, B. H., Duan, R., Liu, Y., & Mong Goh, R. S. (2015). Neural Modeling of Buying

Behaviour for E-Commerce from Clicking Patterns. Proceedings of the 2015 International

ACM Recommender Systems Challenge on - RecSys’15 Challenge.

doi:10.1145/2813448.2813521

Xingjian, S. H. I., Chen, Z., Wang, H., Yeung, D. Y., Wong, W. K., & Woo, W. C. (2015).

Convolutional LSTM network: A machine learning approach for precipitation nowcasting.

In Advances in neural information processing systems (pp. 802-810).

Yeo, J., Kim, S., Koh, E., Hwang, S., & Lipka, N. (2016). Browsing2purchase. Proceedings of

the 25th International Conference Companion on World Wide Web - WWW ’16

Companion. doi:10.1145/2872518.2889394