紙引未來網訊 直觀地講,我們知道關于一個產品或服務的積極的在線討論比消極的討論更有利于銷售。然而,衡量這種需求的增長是一個更復雜的問題。精確的量化需要知道不同形式的在線數據(例如,定量和定性,或者數字和文本)如何影響消費者在研究購買時的決策。
這是一項具有挑戰性的任務,但并非不可能。在我們最近專注于美國汽車行業的工作文件中,我們能夠將市場份額的變化直接歸因于在線產品評論的定量和定性部分。
一、分析線上評論
我們研究了2002-2013年間416個汽車型號的數據。對于每一種車型,我們從消費者的角度捕捉最相關的考慮因素,包括價格、馬力、尺寸和每美元的里程數。然后,我們通過將每個特征插入一個計量經濟學模型來模擬客戶的決策。這樣,我們就可以考慮到汽車本身的任何特征,這些特征可能解釋市場份額的上升或下降。我們通過用每年售出的汽車數量除以總市場規模(即當年美國家庭的數量——因為每個家庭都需要一種交通方式)來衡量我們數據集中汽車的市場份額。
我們還從一個領先的行業網站上獲取公開的消費者評論。每個車型在發布當年平均有45條相關評論;最受歡迎的車型有近600條。
像大多數產品評論一樣,我們研究的評論包括星級評定(一到五星)和文本部分(評論者可以留白)。我們沒有把評論的這兩部分視為相同的內容,而是對文本部分進行了機器學習(ML)的情感分析。在通過亞馬遜的Mechanical Turk招募的人的幫助下,ML模型得到了訓練,他們對評論的樣本集進行了積極或消極的評分。
消費者評論的分叉性質被證明是至關重要的。孤立地看,星級評價對汽車市場份額的影響表現為綜合評價的回報遞減,這意味著當汽車評價已經很高時,較高的評價對市場份額的影響可以忽略不計。因此,一輛五星級的汽車比四星級的汽車在網上看到的需求沖擊要小,這沒有什么直觀的意義。
然而,當我們研究星級和情感評級的相互作用時,情況就變得更加清晰了。回報遞減的影響曲線變成了一條陡峭的上升線,但只適用于那些有高情感評分的模型。換句話說,高星級對市場份額的影響被書面評論的整體情緒所調節。如果沒有文字推薦的語料庫,好的星級評價對消費者來說意義不大。
二、雙系統思維
我們把情感和星級的聯合效應比作丹尼爾·卡尼曼在其暢銷書《思考,快與慢》中推廣的人類認知的“系統1”和“系統2”框架。系統1(快速和直覺)思維對應的是綜合星級評價,它給出了一個快速的眾包產品質量印象。系統2(深思熟慮和理性)涵蓋了書面評論,它要求作者和讀者都付出心理努力。在卡尼曼的框架中,系統2負責認可或重新評估系統1的自動印象,然后將其轉化為信念和行動。
當我們看到一個過于接近完美的星級評價時,我們的懷疑心會引導我們到書面評論中去尋找佐證。如果文本中的熱情沒有評級那么令人印象深刻,我們可能會從決定的邊緣退后一兩步,考慮其他的選擇。
我們在排除了幾個備選方案后發現了支持這一解釋的經驗證據。例如,我們控制了過去的評論對現在可能產生的影響,也就是說,同一款車的前幾款車型的受歡迎程度可能會給當前車型的評論內容帶來色彩,或者說,早期發布的評論可能為后來的評論定下基調。當我們在分析中減少了這些早期作品的權重時,這些發現仍然成立。當考慮到不同的閱讀行為(例如,當人們只閱讀負面評論,或只閱讀最近的評論),我們的分析也是穩健的。
三、對數據戰略家的啟示
盡管我們的研究是在一個特定的行業中進行的,但可以從中得出關于數據驅動策略的普遍教訓。首先,在線數據有多種格式,包括結構化的(如星級)和非結構化的(如書面評論)。一個真正全面的數據策略不僅要包括所有的格式,而且還要研究它們之間的互動方式。這一點很重要,因為當這些不同的格式被打包在一起時,比如在線產品評論,它們可能會向消費者發出不同的信號。只分析一種形式可能會產生對整體數據的歪曲解釋,而整體的觀點更有可能產生驅動消費者行為的線索。
第二,數據驅動的策略應該是取決于背景的。在你對數據的商業影響得出確切的結論之前,你需要知道什么能讓你所在行業的消費者動心,并據此設計實驗。例如,如果我們不首先用一個經過驗證的計量經濟學模型來復制我們所研究的行業的典型購買過程,我們就不可能根據我們所掌握的數據來產生一個清晰的畫面。對數據科學采取即插即用的方法不會讓你達到你需要的目的。
第三,由于人工智能(AI)的進步,我們的研究是一個很好的例子,說明現在所有公司無論大小都可以參與這種可擴展的數據分析。諸如情感分析等工具在技術完善性和可及性方面都有了飛躍性的發展。因此,中小型企業(SMEs)沒有理由不參與曾經為大型成熟公司保留的行動。
無論你的行業或數據復雜程度如何,你最好的戰略賭注是將基于人工智能的能力與全面的數據收集和細致的行業知識相結合。
智慧熊企業數字化管理系統,助力遠程高效處理工作事務,團隊高效配合下單,生產,發貨,采購,財務等事宜。
智慧熊企業數字化管理系統,助力遠程高效處理工作事務,團隊高效配合下單,生產,發貨,采購,財務等事宜。