成果展示

隊伍名稱 我是顯眼包
作品名稱 顯眼包
指導教授 秦群立
團隊成員 陳融陞、陳泓儒、周鈺澧
作品介紹 「顯眼包(VisionBag)」是一款結合人工智慧、機電整合與人因設計的背負式即時字幕系統,旨在協助聽障者與聽力退化者於課堂、演講與公共活動中即時獲取語音資訊。根據世界衛生組織統計,全球約有4.3億人面臨中度以上聽力障礙,但現行聽打服務受限於設備固定、距離過遠及成本高昂,使聽障族群難以即時理解語意內容。「顯眼包」的設計理念在於讓字幕主動靠近使用者,實現資訊可及與溝通平權。 系統採雙平台架構,由Jetson Xavier NX負責語音擷取與AI推論,Raspberry Pi 5負責顯示控制與視覺伺服。語音經增強型語音轉文字模型(Enhanced Speech-to-Text)即時轉錄為文字,再透過改良後處理模型(Improved Text Model)進行降噪、關鍵詞加權與同音字修正,使字幕具高準確率與語意連貫性。字幕內容即時顯示於背負式18吋主螢幕、10.1吋副螢幕及Web App介面,使用者可同步閱讀、調整字體或下載完整紀錄。 硬體結構結合步進馬達、行星減速器與伸縮滑軌,搭配視覺伺服(Visual Servoing)技術,使螢幕能根據觀眾位置自動旋轉與升降,確保字幕始終位於使用者視線範圍。整體重量控制於七公斤以內,續航時間達四小時以上,並於本地端完成所有運算以維護資料隱私。 系統整合六大核心功能:其一,「字幕工坊」負責即時語音轉錄並顯示段落化字幕;其二,「字幕快遞」讓使用者可透過Web App發送協助請求;其三,「接收快遞」由工作人員即時接單,實現行動化服務;其四,「錄字管家」自動記錄完整活動字幕供檢索與下載;其五,「關鍵助手」允許講者上傳講稿以抽取並加權專業詞彙;其六,「關鍵管家」則提供後台管理與語料調整,使轉錄內容更貼近真實語境。 「顯眼包」融合語音辨識、視覺控制與可攜式顯示模組,突破傳統字幕設備受限於場地的問題,讓字幕能隨人移動、即時呈現。此系統不僅提升聽障者的資訊可及性,也展現AI與智慧控制技術於無障礙輔助領域的創新應用,落實數位永續與社會共融的核心精神。
照片