作品介紹 |
在科技發達的現代,語音辨識技術已經成為人們生活中不可或缺的一部份,例如: 手機語音輸入、語音助理(siri、google助理)以及語音控制等。以上這些辨識技術的內容大多是以日常情境與對話的語音進行辨識,因此面對不同領域的情境將無法有很好的辨識效果,以醫療領域來看,在醫院裡護理師的交班工作複雜且要紀錄的內容很多,如果能有相關的語音輔助系統來幫助她們,不僅降低護理人員的壓力,也可以提升效率。
醫院病歷通常包含很多中英文的專有名詞,因此使用一般的語音辨識系統,例如:Google語音辨識,辨識效果都不盡理想,無法直接利用實際運用在醫療場域。本作品針對醫療語音之特定情境(護理人員交班),發展醫療專業情境下對談語句之逐字辨識技術。護理交班醫療語音的特殊性為筆記式精要陳述句型、專業術語詞彙以及中英文混雜,因此無法使用目前現成的資料庫進行訓練,必須透過所蒐集護理師教單錄音檔並進行人工標註,組成中英文醫療語音資料來進行模型訓練。而在模型的部分選用Deep Speech 2,這個模型在中英文語音辨識的任務取得不錯的效能,因此本作品在原網路的骨幹架構上進行修改,讓深度模型在訓練上能更擬合醫療語音資料庫,修改並訓練後,其中對於特殊的醫療詞彙、句型和中英文交雜內容都有顯著的辨識效果。 |