点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

文化人 天下事
正在阅读:  从“听得到”到“听得清”——我们离听觉重建还有多远
首页> 光明日报 > 正文

 从“听得到”到“听得清”——我们离听觉重建还有多远

来源:光明网-《光明日报》2025-08-03 04:05

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  作者:凌震华,张结(分别系语音及语言信息处理国家工程研究中心副主任、教授,副教授)

  听力损失指听力“减损”或“退化”致人耳听觉功能部分或完全丧失,可能发生在单耳或双耳,也有可能是暂时或永久性质。2021年世界卫生组织(WHO)发布的报告显示,听力损失影响全球超过15亿人;第二次全国残疾人抽样调查显示,我国每年新增聋儿约2.3万人。听力损失造成的言语理解困难、社会隔离甚至心理问题,给个人、家庭和社会带来了不可忽视的影响,已成为全社会关注的健康问题。

  听觉重建指应用手术方法或借助助听器、人工耳蜗等听力器具提高或恢复由于不同原因或疾病致成的传音结构功能障碍所致的听力损失。现阶段,从技术、行业规范、价格、服务等方面综合来看,面向儿童听力损失的听觉重建技术和听力器具仍处于“听得到”的阶段,离“听得清”的目标还存在不小差距。听力损失的类型可分为:由外耳、中耳问题引起的传导性听力损失(也就是声音传不进去),内耳、蜗神经病变等引起的感音神经性听力损失,以及混合性听力丧失。

  听力损失的可能成因包括遗传学、老化、暴露于噪声环境、感染、生产相关并发症、耳朵外伤、某些药物或毒素等。听损可分级为轻度、中度、中度至重度、重度、极重度。以助听器、人工耳蜗等听力器具为代表的听觉重建装置是针对听损人士最主要的康复手段。其中,助听器属于非植入式人工听觉技术装置,人工耳蜗、人工听骨、骨桥、人工脑干等属于植入式人工听觉装置。

  在日常言语交流场景中,我们是如何从包含多个说话人的嘈杂声音信号中听懂目标说话人语句的呢?这就是困扰了计算机、声学、信号处理等领域半个多世纪的“鸡尾酒会”问题,要求听力器具不仅能拾音(即“听得到”),而且具有音频信号处理能力(包括噪声抑制、目标声音增强等功能,即“听得清”)。及时有效的干预对面临听力损失风险或有听力障碍的儿童大有裨益,而复杂的病因机制、听障症状和听觉重建需求给加快完善听障儿童的听力健康服务提出了更高要求,也给研发听觉辅助和重建核心器件、听损评测诊断技术和器具、听觉无障碍系统平台等带来了挑战。

  作为最常见的听觉重建器具,助听器最适用于中度及部分重度感音神经性听力损失人群,只要还存在一定残余听力,助听器就会有帮助。技术层面上,助听器分为模拟助听器和数字助听器,前者仅仅具有声音放大功能,后者还有一定的音频信号处理能力。我国助听器在关键部件制造工艺等方面已达到国际水准。然而,“听得到”和“听得清”是两个完全不同的概念,现实中助听器的应用体验也时常让人一言难尽。据报道,不少购物平台宣称的“免验配、免调试,直接佩戴”的助听器,因为价格亲民、操作简便收获了颇高人气,患者使用后虽然可以听到声音,但是有太多噪声,长期佩戴甚至可能导致听力水平进一步恶化。即便是价格过万的数字助听器,在佩戴期间也可能发出“吱吱”的杂音,即啸叫声,微笑、咀嚼、拥抱、误触等都有可能引起啸叫。

  频率补偿是助听器最关键的技术之一,旨在根据用户听力频带损失范围和程度补偿不同频带声音的增益,因此,频带通道数量决定了声音的清晰度,这就体现出听损评测的必要性。现阶段,普通价位的数字助听器基本都具备频率补偿功能,然而在主动降噪、啸叫抑制、立体声重构等音频处理方面还存在不足。自适应滤波是数字助听器音频信号处理的主流技术,具有实时性高的优点,但是对处理日常言语交流更普遍的非平稳声学场景的能力略显不足,导致难以兼顾“听得清”和听感舒适度。随着深度学习技术的快速发展以及在应用中的不断演进,基于深度神经网络的音频处理算法在很多真实声场景中表现出更出色的适用性,已逐渐成为解决数字助听器技术痛点的核心技术途径,AI4hearing因而成为重要的发展方向。

  对于极重度听力损失人群及部分重度听力损失人群,助听器的补偿作用比较有限。人工耳蜗可以将声音转化为电信号后直接刺激蜗神经,因此能更好地补偿听力。随着技术的进步和临床手术的成熟,人工耳蜗植入让越来越多的严重耳鸣、单侧聋等患者受益。人工耳蜗在技术层面克服了助听器的啸叫问题,能更好地兼顾“听得到”和“听得清”的需求,因而,主动降噪和目标声音增强成为人工耳蜗的核心音频处理任务。由于我国在该领域起步较晚,在技术储备、人工耳蜗植入比率、从业人员规模等方面与发达国家相比还存在不小差距。

  由于听力水平对言语功能发育具有促进作用,人工耳蜗植入对语言能力尚未发育完善的重度听力损失儿童尤为重要。然而,一方面,人工耳蜗的价格通常较高,手术费用不菲,再加上术后人工耳蜗的升级、维护及康复训练费用,让不少人望而却步。另一方面,目前我国从事人工耳蜗植入术的相关专业人员还远远不能满足患者的康复需求。

  本质上,以提升声音质量和可懂度为目标的音频信号处理是实现助听器、人工耳蜗等听力器具听觉重建的共性技术,其核心任务就是解决英国科学家科林·切里(Colin Cherry)在1953年提出的“鸡尾酒会”问题(数学角度是欠定问题)。这一问题的声学原理即人耳的掩蔽效应,指人的耳朵只对最明显的声音反应敏感,而对于不明显的声音反应则不敏感,其敏感性可能与音色、音高等因素有关。利用计算机、数字信号处理、微处理器等技术手段研发具有人耳掩蔽效应的音频处理技术,提升复杂声场景下听损人士听力水平,仍然是学术界的热点研究课题。其难点包括两方面:一是听力器具通常尺寸较小,只能搭载1到4个麦克风,导致观测数据所包含的声场景信息量不足;二是听力器具的计算能力较弱,存储空间非常有限,难以部署复杂的音频信号处理算法和大参数量的深度学习大语言模型。“听得清”要求听力器具处理后的音频包含具有立体声效果的目标信号、过滤掉其他噪声,而噪声的类型又具有不确定性,因此完善AI4hearing还需要学术界和产业界共同发力。

  使用听力器具是改善听力水平的直接手段,近年来涌现的读唇法、语音识别、字幕翻译、手语等听力代偿技术(本质属于感官替代)是缓解听力障碍、帮助患者沟通的间接方法。听力代偿要求感官替代技术与听力器具的音频处理功能在时间上依靠蓝牙进行同步,日常交流是不自然的,因此,突破听力器具的音频处理技术瓶颈才是让听损人士回到有声世界的根本任务,听力代偿只能作为辅助技术手段。声场景自适应感知和工作模式自动切换是听力器具智能化的标志之一。近年来,虽然国内外诸多科研团队在自适应场景学习、声音事件检测与分类、快速噪声抑制等音频处理任务上取得了显著进步,甚至研究者们开始探索言语交流场景中脑电信号对改善耳语音处理的潜力,但是目前这些技术与听力器具形成的产业化应用还非常少,其主要原因还是在于听力器具难以承载复杂的音频信号处理算法。不过,这些都是实现“听得清”的重要研究方向。

  总的来说,现阶段面向儿童听力损失的听觉重建技术和听力器具仍然处于“听得到”的阶段,离“听得清”的终极目标还有不小差距。相关问题需要医疗机构、企业、高校、家庭等全社会凝聚力量共同攻克,持续规范助听器验配流程,提升从业人员数量和专业水平,真正让听觉重建技术实现数字化和智能化,让助听器、人工耳蜗等听力器具实现大众化,为广大听力损失儿童能够“听得清”带去福音。

  《光明日报》(2025年08月03日 05版)

[ 责编:姜姝琪 ]
阅读剩余全文(