1. 產品數據分析的內容有哪些
1、計劃
比如公司的采購計劃、訂貨計劃、上市計劃、營銷計劃、活動計劃、清貨計劃等等。計劃的要點是計劃的合理性,絕不是大門一關苦思冥想出來的。比如說訂貨計劃,我們需要考慮1-2年的同期數據,結合現在最新的市場信息來規劃。對不同的品類、價位、深寬度進行規劃。
2、反饋
公司的計劃出來了需要在不同的節點收集數據進行匹配,是否符合計劃預期。比如說原先的營銷計劃在時間A點的庫存率要求是50%。現在的數據是55%。比計劃高了,這樣的比較主要是進行預警用。避免發現的太晚。還有一類反饋是與計劃無關的。是常態的商品營銷信息反饋。
3、總結
每一季的結束或者一個月的結束商品需要做個總結。其實現在很多反映商品數據沒發揮作用的人來說他們做了太多的統計總結,但總結的結論卻不能夠用來做計劃。就行公司是不是的去做數據反饋,但是不能起到預警的作用。
2. 干貨 零售行業的數據挖掘七步走
干貨:零售行業的數據挖掘七步走
文 | @ETwise
對於沃爾瑪、華潤萬家、百佳等零售大超市而言,每天都有很多客戶通過會員卡進行購買,不斷積累了很多銷售數據,如何利用這些數據,從數據中挖掘金礦,很值得每個商家去思考。盡管目前零售商有不少的IT系統去支撐企業常規的分析(如銷售量、銷售額、熱銷SKU等),但實際上還是未能從數據角度深入挖掘客戶的價值,僅僅從經營分析的角度來滿足了常規分析工作。
本文從個人的角度去談一下如何使用數據挖掘幫助零售商提升生意,讓數據真正地去指導企業經營,最大限度地發揮數據提供商業決策的作用。
第一、開展會員制能夠幫助企業採集更多會員數據,更有利於開展數據挖掘的工作,同時也有利於培養客戶忠誠度。
第一、開展會員制能夠幫助企業採集更多會員數據,更有利於開展數據挖掘的工作,同時也有利於培養客戶忠誠度。
在實施會員制的時候,必須要特別注意兩個關鍵信息的採集:會員卡ID、客戶聯系號碼或者郵箱,因為這兩個關鍵信息對信息採集及後期的精準營銷有很大的幫助作用。而微信、微博等社交媒體的橫行,若零售商能夠通過相關活動讓客戶關注企業的微信、微博,對培養客戶忠誠度也是有很大的幫助。
會員制有助於為企業培養眾多忠實的顧客,建立起一個長期穩定的市場,提高企業的競爭力。通過會員制,可以有效穩定老客戶,同時開發新顧客。因為零售商給會員提供的是優惠的價格,對新顧客吸引力很大,同時大部分會員卡是可以外借的,也給新客戶提供了機會,大大增加其成為會員的可能性。
會員制營銷能夠促進企業與顧客雙向交流。顧客成為會員後,通常能定期收到商家有關新商品的信息並了解商品信息和商家動態,有針對性地選購商品。除此之外,企業能夠及時了解消費者需求的變化,以及他們對產品、服務等方面的意見,為改進企業的營銷模式提供了依據。
輸入標題
第二、開展零售商的數據挖掘項目,必須要重點提供以下幾個表的關鍵信息:
銷售表:卡號、銷售店ID、銷售日期、產品名稱、產品價格、銷售數量、銷售金額、折扣等信息。
產品表:產品ID、產品名稱、建議零售價、實際銷售價、一級類別、二級類別、三級類別、四級類別、品牌等信息。
客戶表:卡號、發卡店ID、城市、號碼、郵箱、企業或個人標識、企業名稱、所在行業、地址等。
零售店表:店ID、店名、所屬城市、店等級等。
其中銷售表、產品表、客戶表比較重要,而產品表梳理對數據分析及數據挖掘團隊而言,是做好項目的關鍵,必須要耗費大量的時間。
輸入標題
第三、與零售商明確數據挖掘目的,能夠讓分析團隊與零售商之間獲得更大的信任,同時有利於項目的順利開展。
成熟的分析團隊,比較關注零售商的商業出發點,從客戶商業價值出發,抓住客戶關注點,一點一點地做好相應的落地分析工作。
客戶最常見想讓數據幫助其解答的幾大問題:
如何讓活躍的客戶購買更多的產品,最大程度地釋放其價值?
如何喚醒沉默客戶,讓其轉化為活躍客戶?
哪些客戶是我的重點客戶群?其有什麼樣的特徵?
哪些重點客戶流失了?為什麼流失?後期怎樣開展挽留手段?
……
輸入標題
第四、通過數據開展客戶細分,明確各個群體的特徵。
對於零售數據而言,必須要深入零售行業兩大客戶群:企業及個人。企業客戶的特徵和個人客戶的特徵有很大的區別。
企業特徵主要表現:采購量比較大,經常進行團購或批發,銷售量和銷售額都比較大,為零售商的重點客戶群。盡管數量不多,但是卻貢獻了零售商的60%以上的銷售額。而企業的行為經常有:超大型采購、中型采購、一般采購。對企業數據挖掘,需要深入了解企業的所屬行業、采購額度、采購規律、采購產品偏好、是否流失、流失的原因調查等信息,有助於幫助零售商開展相應的營銷策略。
對於個人,則需要關注哪些是活躍客戶、哪些是新增客戶、哪些是沉默客戶、客戶價值是怎樣的、哪些節日是重點高峰期、偏好的產品是哪些等等,這些有助於零售商開展銷售、備貨等工作。
第五、結合5W1H分析法開展零售分析與挖掘。
What:銷售情況怎麼樣?有多少用戶?來了多少次?每次消費多少錢?買了什麼東西…….
Where:哪些門店銷售最好?為什麼呢?(交通、地區等)…….
When:哪個月份銷售得最好?哪個節日是銷售高峰期…….
Who:是哪些客戶?有什麼樣的特徵?偏好買哪些產品?產品規格是怎麼樣的…….
Why:為什麼買哪些產品?為什麼買那麼多?會不會繼續購買…….
How:怎樣提高客戶重購?怎樣喚醒客戶?怎麼進行交叉銷售?怎樣幫助鋪貨……
第六、協助零售商開展營銷活動設計、營銷活動執行、營銷評估與優化。
因為數據挖掘是一個閉環的流程,不是撰寫挖掘報告、輸出營銷客戶名單就是項目成功的,必須協助零售商開展相應的營銷設計、營銷活動執行、營銷評估及優化工作。從而確保數據挖掘有效落地,為客戶真實產生商業價值,擴大生意規模。
營銷活動設計常有:優惠打折、派發試用裝、贈送禮品、多倍積分等,可以通過不同的細分客戶群有針對性地開展不同的營銷活動,並計算不同群體及不同活動的投入產出比,便於後期不斷優化數據挖掘規則。
第七、關鍵成果固化IT系統,實現數據挖掘成果固化落地。
對於零售商而言,數據挖掘是個不大不小的投入,對於關鍵的成果輸出,總希望能夠把成果規則進行IT固化,實現自動代替手工操作,這個時候經常需要搭建一個成果固化模塊或系統,讓數據挖掘能夠最大限度幫助企業。
3. 數據挖掘的入門概念
數據挖掘的入門概念
1 數據挖掘
數據挖掘(Data Mining,簡稱DM),是指從大量的數據中,挖掘出未知的且有價值的信息和知識的過程。
2 機器學習 與 數據挖掘
與數據挖掘類似的有一個術語叫做」機器學習「,這兩個術語在本質上的區別不大,如果在書店分別購買兩本講數據挖掘和機器學習的書籍,書中大部分內容都是互相重復的。具體來說,小的區別如下:
機器學習:更側重於技術方面和各種演算法,一般提到機器學習就會想到語音識別,圖像視頻識別,機器翻譯,無人駕駛等等各種其他的模式識別,甚至於谷歌大腦等AI,這些東西的一個共同點就是極其復雜的演算法,所以說機器學習的核心就是各種精妙的演算法。
數據挖掘:更偏向於「數據」而非演算法,而且包括了很多數據的前期處理,用爬蟲爬取數據,然後做數據的清洗,數據的整合,數據有效性檢測,數據可視化(畫圖)等等,最後才是用一些統計的或者機器學習的演算法來抽取某些有用的「知識」。前期數據處理的工作比較多。
所以,數據挖掘的范疇要更廣泛一些。
3 數據挖掘所覆蓋的學科
數據挖掘是一門交叉學科,覆蓋了統計學、計算機程序設計、數學與演算法、資料庫、機器學習、市場營銷、數據可視化等領域的理論和實踐成果
4 數據挖掘的誤區
誤區一:演算法至上論。認為數據挖據是某些對大量數據操作的演算法,這些演算法能夠自動地發現新的知識。
誤區二:技術至上論。認為數據挖據必須需要非常高深的分析技能,需要精通高深的數據挖掘演算法,需要熟練程序開發設計。
這兩種認知都有一定的偏頗。實際上,數據挖掘本質上是人們處理商業問題的方法,通過適量的數據挖掘來獲得有價值的結果,技術在隨著大數據時代的來臨變得愈發重要,但是最好的數據挖掘工程師往往是那些熟悉和理解業務的人。
5 數據挖掘能解決什麼問題
商業上的問題多種多樣,例如:
「如何能降低用戶流失率?」
「某個用戶是否會響應本次營銷活動?「
"如何細分現有目標市場?"
「如何制定交叉銷售策略以提升銷售額?」
「如何預測未來銷量?」
從數據挖掘的角度看,都可以轉換為五類問題:
分類問題
聚類問題
回歸問題
關聯分析
推薦系統
5.1 分類問題
簡單來說,就是根據已經分好類的一推數據,分析每一類的潛在特徵建立分類模型。對於新數據,可以輸出新出具屬於每一類的概率。
比如主流郵箱都具備的垃圾郵件識別功能:一開始,正常郵件和垃圾郵件都是混合在一起的,如果我們手工去點擊哪些是垃圾郵件,逐漸的,垃圾郵件就會自動被識別放到垃圾文件夾。如果我們對於混在正常郵件中的垃圾持續進行判斷,系統的識別率就會越來越高。我們人工點擊判斷,相當於預先分類(兩類:垃圾郵件和非垃圾郵件),系統就會自己學習兩類郵件的特徵建立模式,對於新郵件,會根據模式判斷屬於每個類別的可能性。
分類演算法示意
5.2 聚類問題
和分類演算法是不同概念,但是工作中業務人員經常誤用。 聚類的的目的也是把數據分類,但類別並不是預先定義的,演算法根據「物以類聚」的原則,判斷各條數據之間的相似性,相似的就歸為一類。
比如我有十萬消費者的信息數據,比如包括性別,年齡,收入,消費等,通過聚類的方法事可以把這些數據分成不同的群,理論上每群用戶內都是相似性較高的,就可以覆蓋分群用戶制定不同的策略
聚類演算法示意
5.3 回歸問題
回歸問題和分類問題有點類似,但是回歸問題中的因變數是一個數值,而分類問題,最終輸出的因變數是一個類別。簡單理解,就是定義一個因變數,在定義若干自變數,找到一個數學公式,描述自變數和因變數之間的關系。
比如,我們要研究房價(Y),然後收集房子距離市中心的距離(X1),面積(X2),收集足夠多的房子的數據,就可以建立一個房價和距離、面積的方程式(例如Y=aX1+bX2),這樣給出一個新的距離和面積數據,就可以預測這個房子的價格。
回歸問題示意
5.4 關聯分析
關聯分析主要就是指」購物籃分析「,很有名氣案例是【啤酒與尿布】的故事,」據說「這是一個真實的案例:沃爾瑪在分析銷售記錄時,發現啤酒和尿布經常一起被購買,於是他們調整了貨架,把兩者放在一起,結果真的提升了啤酒的銷量。後來還分析背後的原因,說是因為爸爸在給寶寶買尿布的時候,會順便給自己買點啤酒……
所以,關聯分析就是基於數據識別產品之間潛在的關聯,識別有可能頻繁發生的模式。
5.5 推薦系統
利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什麼產品,模擬銷售人員幫助客戶完成購買過程。也就是平時我們在瀏覽電商網站、視頻網站、新聞App中的"猜你喜歡"、「其他人也購買了XXX」等類似的功能。
5.6 數據挖掘的工作流程
數據挖掘的通用流程叫做CRISP-DM(Cross Instry Standard Process-Data Mining)數據挖掘方法論。
CRISP-DM
6.1 商業理解
商業理解階段主要完成對商業問題的界定,以及對企業內外部資源進行評估與組織,最終確定將企業的商業目標轉化為數據挖掘目標,並制定項目的方案
6.2 數據理解
了解企業目前數據現狀,提出數據需求,並盡可能多的收集數據。通過初步的數據探索,快速了解數據的質量
6.3 數據准備
在建立數據挖掘模型之前對數據做最後的准備工作,主要是把收集到的各部分數據關聯起來,形成一張最終數據寬表。這個階段其實是耗時最長的階段,一般會占據整個數據挖掘項目的70%左右的時間,包括數據導入、數據抽取、數據清洗、數據合並、新變數計算等工作。
6.4 模型構建
模型構建是數據挖掘工作的核心階段。主要包括准備模型的訓練集和驗證集,選擇並使用適當的建模技術和演算法,模型建立,模型效果對比等工作
6.5 模型評估
模型評估主要從兩個方面進行評價:
1)技術層面:
- 設計對照組進行比較。
- 根據常用的模型評估指標進行評價,如命中率、覆蓋率、提升度等
2)業務經驗:業務專家憑借業務經驗對數據挖掘結果進行評估
6.6 模型部署
將數據挖掘成果程序化,將模型寫成存儲過程固化到IT平台上,並持續觀察模型衰退變化,在發生模型衰退時,引入新的變數進行模型優化。
4. 如何自動挖掘其中的數據呢
QUEST是IBM公司Almaden研究中心開發的一個多任務數據挖掘系統,目的是為新一代決策支持系統的應用開發提供高效的數據開采基本構件。系統具有如下特點:提供了專門在大型資料庫上進行各種開採的功能:關聯規則發現、序列模式發現、時間序列聚類、決策樹分類、遞增式主動開采等。各種開采演算法具有近似線性(O(n))計算復雜度,可適用於任意大小的資料庫。演算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來。為各種發現功能設計了相應的並行演算法。.MineSetMineSet是由SGI公司和美國Standford大學聯合開發的多任務數據挖掘系統。MineSet集成多種數據挖掘演算法和可視化工具,幫助用戶直觀地、實時地發掘、理解大量數據背後的知識。MineSet有如下特點:MineSet以先進的可視化顯示方法聞名於世。提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J健⒐亓 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br> 支持多種關系資料庫。可以直接從Oracle、Informix、Sybase的表讀取數據,也可以通過SQL命令執行查詢。多種數據轉換功能。在進行挖掘前,MineSet可以去除不必要的數據項,統計、集合、分組數據,轉換數據類型,構造表達式由已有數據項生成新的數據項,對數據采樣等。操作簡單、支持國際字元、可以直接發布到Web。DBMinerDBMiner是加拿大SimonFraser大學開發的一個多任務數據挖掘系統,它的前身是DBLearn。該系統設計的目的是把關系資料庫和數據開採集成在一起,以面向屬性的多級概念為基礎發現各種知識。DBMiner系統具有如下特色:能完成多種知識的發現:泛化規則、特性規則、關聯規則、分類規則、演化知識、偏離知識等。綜合了多種數據開采技術:面向屬性的歸納、統計分析、逐級深化發現多級規則、元規則引導發現等方法。提出了一種互動式的類SQL語言——數據開采查詢語言DMQL。能與關系資料庫平滑集成。實現了基於客戶/伺服器體系結構的Unix和PC(Windows/NT)版本的系統。
5. 產品經理要掌握那些數據知識
在我看來,作為產品經理,必須要知道的是數據和產品之間的關系問題,這也是我認為產品經理需要知道的數據知識。
我的團隊里經常有技術人員和我抱怨說,某某產品經理又過來要數據了,今天已經是第三回了。
我問要什麼數據了?
他會告訴我說,某某群體用戶的數據,不同群體要的類似數據要了3回了……
我一聽就知道,這又是一個很讓人無奈的產品經理,沒有概念,不願意整理思路,又只把技術當技術使喚的人。
從這些方面出發,你才能構思,你到底需要了解哪些數據知識。
1、用戶的數據信息
2、收益的數據信息
3、用戶和收益之間的關系
4、產品發布前後的收益變化
5、產品發布前後的用戶變化
6、產品的穩定性情況
……
都是需要你去挖掘和理解的。
所以,簡單的將上面的話總結一下就是,產品經理必須知道:數據是什麼?來源是什麼?指標是什麼?上級想要什麼?如何展示出來。