作品介紹 |
當聽力障礙者因無法清晰地聽到自己或他人說話的聲音,經常會發生發音不清的情況。這種語音不清晰的現象常常讓他們在與他人交流時感到困惑與挫敗,因為對方很可能聽不懂他們想要表達的內容。這樣的溝通障礙不僅讓聽障者面臨實質上的不便,也可能導致心理上的不自信,進一步影響社交互動與日常生活品質。
為了解決這個問題,本團隊傾力開發了一個名為「聾正常溝通師」的智慧系統,旨在幫助聽障者更加流暢地與他人交流。這個系統由硬體與軟體兩大部分組成,結合創新技術與使用者友好的設計,力求提供完整而實用的溝通支持。
在硬體設計方面,我們選用了領夾式無線麥克風作為主要的聲音收錄設備。這種設計不僅輕便易用,還能更貼合日常生活的使用情境,使使用者能夠自然地進行對話,而無需刻意將嘴巴對準手機或其他裝置。這樣的設置大大提升了使用便利性,讓聽障者能更自在地參與各類場合的對話,無論是在家庭聚會中、學校課堂上,還是在公共場所。
而在軟體部分,我們自研並訓練了一套專門的語音轉換模型,名為「DDC-GAN」,這個模型結合了CNN(卷積神經網絡)和CycleGAN-VC2技術。DDC-GAN模型具備強大的語音轉換能力,能夠將聽障者說出的不清晰語音轉換成清晰可理解的語音,從而幫助聽者輕鬆聽懂對方的話語。整個系統被設計成一個Web App,使用者可以輕鬆地在手機或其他設備上進行操作,享受即時轉換功能。
更進一步,我們的系統還整合了Google的Speech-to-Text技術,將清晰語音即時轉換為文字顯示,這對於無法直接理解語音內容的傾聽者提供了額外的幫助。這項功能能夠協助聽障者和他們的溝通對象在特殊情境下進行更為順暢的交流。當聽障者說話時,使用者只需按下錄音按鈕開始說話,再按下轉換按鈕,DDC-GAN模型會迅速將語音轉化為清晰的語音並顯示對應的文字,讓交流更為高效且精準。
我們深信「聾正常溝通師」系統能夠幫助聽障者改善日常溝通困難,從而增加他們在社會互動中的信心與自在感。我們期望這個創新解決方案能成為聽障者和他們周圍人群之間的橋樑,消除溝通障礙,讓每一個對話都更加自然流暢。 |