在先前幾篇文章中,我們分享了如何透過語音識別技術(Speech to Text、STT),將客服中心內專員與客戶的對話,轉換成可供分析的對話文本。而要將這些文本「數據」轉換成對管理者有用的「資訊」,那還需要有文本分析的技術,來抽取出文本中有價值的資訊。本文會為各位簡單介紹何謂文本分析,可能運用的場景與背後基本的技術原理。
文本分析相對於過去傳通分析最大的差別在,傳統數據分析處理的是「結構化的資料」-資料本身具有明確的定義與質,如一張固定結構的表格或資料庫。然而文本分析所處理的數據,一開始並沒有特定的結構。就像人講話一樣有長有短。需要經過加工與處理後,才能轉換成可供分析的數據。而這些非結構化的數據又來自哪裡呢? 如每天發佈的新聞、社群媒體(Facebook、Twitter)上的留言、論壇、部落格等。甚至非文字的聲音,圖像等都算在非結構資料的範圍。
文本分析應用場景
現在所謂大數據分析非常火熱,也越來越多企業投入研究文本分析相關應用。究竟文本分析能帶來什麼樣的價值。以下分享幾個應用場景供各位參考。
主題提取:
人類每天產生的文字與內容,數量早已超過我們的想像。不論是專利文件、研究論文或部落格文章。主題提取的技術嘗試透過演算法自動找出這篇文章的主題為何,將大量的文字壓縮成幾個重要的關鍵字詞供後續分析使用。
情緒分析:
情緒分析最主要的目標是嘗試從大量的文字中,辨識出正面與負面等情緒。透過辨識情緒,企業可以找出社群媒體中不滿意的客戶,或監控幾個指標性的論壇部落格,是否出現不利企業的言論。透過提早發現不滿意客戶的貼文,在事態擴大前盡快回應處理,降低危機的破壞性。
意見探勘:
這源自於傳統上的輿情分析。網路輿情分析,是透過收集並分析網路上消費者發表的意見,了解目標客群對於企業品牌、產品或服務、甚至促銷活動的想法。透過分析的結果,調整優化現有的服務內容或產品研發方向。
回到客服中心本身、因近年全渠道客服(Omni-channel)的快速發展,客服中心擁有眾多文字的對話記錄與email文件等。加上透過語音識別技術,我們可以收集到客戶更直接的回應。網路上搜集回來的資料,因很難確認資料來源的真實性與身份,有時在抱怨的也不一定是你的客戶。然而客服中心內的資料因紀錄的都是實際客戶的互動,故更加的精準。應用場景可參考『重新挖掘潛藏在客服中心的顧客之聲』,該文中有更多如何應用客服中心對話資料的討論。
如何實現?
進行文本分析可初步分成下列幾個步驟:
- 選定目標:根據本次分析目標,決定從何蒐集數據。如要針對航空業者的服務進行分析,便會挑選如知名旅遊部落客、背包客棧或Facebook上相關旅遊粉絲團進行。
- 數據蒐集:將目標網站的文本資料下載回來,網站的資料透過暱稱”爬蟲”的技術將文本抓取下來。
- 斷字斷句(非結構化轉結構化):`將文本轉換成可供分析使用的單詞。
- 資料分析:根據本次分析目的建立相關模型。趨勢性分析用於追蹤一定時間內,產品在網路上的聲量與熱度,以及談論到相關產品時的熱門主題。情緒分析可用於標記高風險的客戶,提早找出可能,並提早回應。
- 資料視覺化:將分析的結果,轉換成視覺化的呈現。提供企業決策時使用。
作者:德鴻科技 售前顧問 David