語(yǔ)音是人類交流的重要方式,但說(shuō)話者的健康狀態(tài)(例如神經(jīng)疾病、癌癥、外傷等原因?qū)е碌穆曇粽系K)和周圍環(huán)境(噪音干擾、傳播介質(zhì))往往會(huì)影響聲音的傳輸和識(shí)別。研究人員一直在改進(jìn)通用語(yǔ)音識(shí)別和交互技術(shù),這些技術(shù)可以很好地處理細(xì)微的聲音或嘈雜的環(huán)境。多通道聲波傳感器可以提高聲音識(shí)別的精度,但因體積較大而無(wú)法佩戴。近期,清華大學(xué)的研究團(tuán)隊(duì)開(kāi)發(fā)了一種基于石墨烯的智能可穿戴人工喉(AT),可以實(shí)現(xiàn)語(yǔ)音感知和發(fā)聲。研究成果發(fā)表在《Nature Machine Intelligence》期刊,論文的標(biāo)題“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
該研究團(tuán)隊(duì)通過(guò)激光直寫技術(shù)在超薄聚酰亞胺薄膜上轉(zhuǎn)化出基于石墨烯的智能可穿戴人工喉(AT),實(shí)現(xiàn)了對(duì)聲音信號(hào)和機(jī)械運(yùn)動(dòng)的混合模態(tài)的感知,使AT能夠獲得低基頻信號(hào),同時(shí)具有抗噪聲的語(yǔ)音感知能力。實(shí)驗(yàn)結(jié)果表明,混合模態(tài)AT能夠檢測(cè)基本語(yǔ)音元素(音素、聲調(diào)和單詞),平均準(zhǔn)確率達(dá)到99.05%。此外,通過(guò)集成AI模型,AT識(shí)別出了喉切除術(shù)患者含糊說(shuō)出的日常詞匯,準(zhǔn)確率超過(guò)90%。同時(shí),AT還可以通過(guò)熱聲效應(yīng)實(shí)現(xiàn)聲音的播放功能,以恢復(fù)患者的發(fā)聲能力。
該研究提出的AT具有制作工藝簡(jiǎn)單、性能穩(wěn)定、抗噪性強(qiáng)、可集成發(fā)聲等特點(diǎn),使其成為下一代語(yǔ)音識(shí)別和交互系統(tǒng)的有力工具。
注:此研究成果摘自《Nature Machine Intelligence》雜志,文章內(nèi)容不代表本網(wǎng)站觀點(diǎn)和立場(chǎng),僅供參考。
知前沿,問(wèn)智研。智研咨詢是中國(guó)一流產(chǎn)業(yè)咨詢機(jī)構(gòu),十?dāng)?shù)年持續(xù)深耕產(chǎn)業(yè)研究領(lǐng)域,提供深度產(chǎn)業(yè)研究報(bào)告、商業(yè)計(jì)劃書(shū)、可行性研究報(bào)告及定制服務(wù)等一站式產(chǎn)業(yè)咨詢服務(wù)。專業(yè)的角度、品質(zhì)化的服務(wù)、敏銳的市場(chǎng)洞察力,專注于提供完善的產(chǎn)業(yè)解決方案,為您的投資決策賦能。
2024-2030年中國(guó)語(yǔ)音識(shí)別行業(yè)市場(chǎng)現(xiàn)狀分析及投資前景研判報(bào)告
《2024-2030年中國(guó)語(yǔ)音識(shí)別行業(yè)市場(chǎng)現(xiàn)狀分析及投資前景研判報(bào)告》共十一章,包含中國(guó)語(yǔ)音識(shí)別行業(yè)重點(diǎn)企業(yè)研究,中國(guó)語(yǔ)音識(shí)別行業(yè)投資機(jī)會(huì)透視和風(fēng)險(xiǎn)分析,研究總結(jié)及投資建議等內(nèi)容。
版權(quán)提示:智研咨詢倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán),對(duì)有明確來(lái)源的內(nèi)容注明出處。如發(fā)現(xiàn)本站文章存在版權(quán)、稿酬或其它問(wèn)題,煩請(qǐng)聯(lián)系我們,我們將及時(shí)與您溝通處理。聯(lián)系方式:gaojian@chyxx.com、010-60343812。