news banner

Data

 

數據分析的風潮在幾年間席捲了全球。一方面是因為手持設備數量不斷增長,機器產生的數據越來越多,另一方面,因為監測變得容易,人與人之間互動產生的數據也持續暴增。

大量的數據滋養了過去停滯不前的人工智慧,使其達到了新的里程碑。而在商業應用上,企業主特別關心的是那些「跟人有關的數據」,也就是顧客的數據。

錄音是一個歷史悠久的技術。貼近顧客的客戶服務產業,基於法規和商業理由,存放了大量的錄音檔。這些錄音檔,有時能用來證明或是確認服務人員與顧客的對話。但長期以來都像是個黑盒子,看不清裡面有什麼。直到這幾年,這個黑盒子才開始與數據分析的趨勢接軌。

第一個原因,是人們漸漸無法忍受不透明的數據。許多新興企業透過網路行銷,並販售商品,絕大部分都是原生於網路的文字數據。這些文字數據都非常容易被集中管理,檢索,與分析。但過傳統方式留下的聲音與影像,並不是那麼容易用機器分析,需要真人慢慢判讀。這種落差,讓企業想找出新的方法重新檢視舊資料。

另一個契機,就是近年影像和聲音辨識技術的重大進展。影像識別已經帶來像是自動駕駛等等創新應用。語音識別也到了可商用的準確度。事實上,每個人口袋裡的智慧型手機都有簡短互動的語音識別能力。但說到真正能發揮語音識別技術的,還是莫過於日夜都有大量錄音湧入的客服中心產業。

 

錄音透明化

從一些訪談中我們觀察到,現今許多客服主管,仍必須用人工聽錄音的方式,試圖找出服務過程的缺失與細節。

有個案例是來自知名的商業銀行,關於顧客打來抱怨保單的金額和當初銷售不符。在這種情況下,客服主管必須逐一聽過前面每一通錄音,才能確認到底是銷售人員的缺失,還是顧客自己搞錯了。

在這個幾乎什麼都可以搜尋的時代,客服主管卻只能一通一通的慢慢聽錄音,是一件非常耗費心力的事。

數據的價值,是建立在數據的可搜尋性。沒有辦法被搜尋的數據,就沒有價值,也就沒有意義。然而,改變這項限制的時機與工具已經成熟。企業必須思考一個問題:有什麼數據是我們還不能搜尋分析的?

而對客服中心來說,就是如何讓錄音成為可分析的數據。

這將帶來非常多好處:

  • 看見客訴的前因後果
  • 發現客服人員的互動問題
  • 挖掘潛在的銷售機會

錄音數據的透明化,可說是關乎企業的時間成本,以及潛在銷售獲利的關鍵。

 

關鍵技術

要做到錄音可分析,現在有三個主要步驟:第一,運用語音轉文字(Speech to Text)的演算法把音檔轉成文字數據;第二,運用搜尋引擎或分析工具過濾並處理;最後,用視覺化的方式呈現給使用者。

要做到這三件事,需要的關鍵技術如下:

 

  • 容易擴容的儲存系統(Software Defined Storage)

原始錄音檔需要非常大量的儲存空間,轉譯成文字後若要做更多應用,也需要與其他數據(例如社群媒體、文字客服等數據)整合,這些都需要能夠乘載大量數據的儲存系統。另一方面,因應錄音量可能暴增,必須具備彈性擴容的能力。這對傳統的字料庫與伺服器都是很大的挑戰。許多新興企業會採用雲端服務,例如亞馬遜雲端服務(Amazon Web Service)提供了線上巨量且方便擴容的儲存。但基於客服中心的數據涉及顧客的個人資訊,如果不適合直接使用雲端服務,企業就必須有能力自建軟體定義儲存(software defined storage)系統。才能在離線的狀態下,提供大量且彈性的儲存。

 

  • 語音轉文字引擎(Speech-to-Text Engine)

語音轉文字引擎,是讓錄音可以被分析的關鍵。上述提到,語音辨識的成熟度已經相當高,但由於需要大量訓練用數據,對一般企業來說仍不是一個能夠自建的工具。基於這個理由,許多雲端公司都有提供語音轉文字的API可以使用。像是IBM的Bluemix,或是Microsoft Azure。但同樣的,客服產業的特殊性可能不適合直接使用雲端服務。此時就需要跟專業的語音辨識公司合作。建立一個辨識率高的引擎並不容易,有許多環節需要調整。英文辨識良好的引擎未必能對中文運作,就算同一個語言,不同地區的口音也會造成影響。另一個需要花心思的環節,是辨識後文字的處理方式。如何斷詞,標記等等,都會影響到後續的文字分析是否準確。

 

  • 搜尋引擎與資料處理工具(Search Engine and Data Processing Tool)

現今做數據分析的技術已經非常普遍,像是熱門的Hadoop, Spark等資料處理工具。還有讓企業能夠自建高效搜尋引擎的Apache Lucene, Elasticsearch等等。對客服中心來說,自建搜尋引擎是非常適合的選項。錄音經過語音辨識成為文字檔,然後被搜尋引擎索引,進而成為可搜尋的數據。如前文提到,有時客服中心的需求是追蹤特定的電話內容,透過搜尋引擎,就可以在毫秒間定位到對應的錄音。

 

  • 彈性的模型匹配功能(Pattern Matching Feature)

為了讓使用者能夠鎖定特定的錄音,或是分析錄音之間的趨勢,必須能夠彈性地定義匹配方式,也就是如何設計一個適切的模型匹配(Pattern Matching) 功能。技術上可以運用搜尋引擎與機器學習,視需求找出精準或模糊的匹配結果。

 

  • 友善的操作介面(User Interface for Analysts)

最後一個關鍵是操作介面。介面的實作方式很多,而要做出跨平台方便使用的介面,較主流的做法是使用Html5網頁技術。然而,好的操作性必須倚賴設計,錄音分析的獨特性,在於必須兼顧量與質兩者。一方面要能夠看出海量數據間的大趨勢,另一方面也要能夠鎖定個別錄音,去挖掘客戶對話中的癥結點在哪裡。這需要獨特的介面設計,用視覺畫圖表的方式呈現大數據,並對個別錄音能夠做深入紀錄。

 

企業必須體認到,透過這些技術,客服中心可以擁有前所未有的利器,可以剖開錄音的黑盒子,讓聲音成為有意義的數據。

 

作者:德鴻科技 研發部 Pei