随着大数据的深入应用,机器学习已经进入医疗领域。过去数年间,出现了诸多“机器”准确进行医学诊断的例子。今天,DT君就和大家分享介绍一个最新利用智能手机和机器学习技术改进医疗服务的案例。
查尔斯·玛尔玛(CharlesMarmar),纽约大学兰贡医学中心精神病学系主任,一位有着40年临床经验的精神科医生。但是,即便是这位经验丰富的医生,当要给一位刚下战场的退伍*人进行评估时,他仍不能%确认这位*人是否患有创伤后应激障碍(PTSD)。
查尔斯·玛尔玛,正在领导他的团队开展语音诊断相关技术研究
对此,玛尔玛解释道:“如果一名*人想要刻意隐瞒他的病情,或者对于这些问题感到羞愧,比如我问他每天晚上会做哪些噩梦时,他可能会说自己睡的很好。这样会直接影响我诊断的准确性。”
对于像PTSD这样的精神障碍,通常无法利用血液检查进行诊断,而且人们常常对他们的心理健康问题也难以启齿,因此这些病症经常无法得到及时的诊断。
而这也让语音诊断技术有了一展身手的机会。
人类语音数据是关于人体健康的丰富信息源,研究人员认为微妙的声音变化可以指示出人体潜在的医学状况或疾病风险。目前,最新科技成果已经实现通过智能手机和其他可穿戴设备远程监控人体健康状况,这些设备通过记录人们说话语音,并对其分析判断这些语音中是否暗示着某种疾病的发生。
通过五年多来的调查研究,玛尔玛收集了大量来自退伍*人的声音样本,并对其进行详细分析,如音量,音调,节奏,速率等等,以观察这些数据与PTSD,创伤性脑损伤(TBI)和抑郁症等不可见损伤疾病的相关性。研究人员使用机器学习来挖掘声音中的特征,利用算法找出这些患者的声音模式,并将其与来自健康人的声音样本进行比较。
例如,具有精神或认知问题的人说话时会拉长某些特定的声音,或者在进行短语发音时会伴随复杂的面部肌肉运动。
上图显示为在一段冠心病患者和控制组语音的功率谱密度对比(PSD)红色为冠心病患者,绿色为健康的控制组
通过与北加州非营利研究机构SRI的研究人员合作,玛尔玛目前已经从退伍*人声音中的个特征中挑选出30个声音特征,这些声音特征目前似乎可以确认与PTSD和TBI有关。
早在年,玛尔玛及其团队开发的语音测试技术在对39名男性的研究中,成功区分PTSD患者和健康志愿者的准确率就已达到77%。现在,该研究已收集了很多语音记录。目前,玛尔玛所开发的语音诊断技术已经可以区分PTSD和TBI这两种疾病。
创伤后精神紧张性精神障碍(PTSD)已经成为美国*人中的一种常见精神疾病
“如果我们可以获得更多的临床和患者心理疾病相关数据,包括语音特征,那么这项技术对医疗和精神疾病的诊断也将更加准确,”玛尔玛说。然而到目前为止,美国食品和药物管理局尚未批准任何语音测试技术来诊断疾病。
除了心理健康,梅奥诊所(医院)正在探索利用声带生物指标,改善对心脏病患者的远程健康监测水平。目前,它正与以色列公司BeyondVerbal合作,对冠状动脉疾病(最常见的心脏病类型)患者的声音进行测试。他们认为,由动脉硬化引起的胸痛可能会对患者发声产生影响。
在初步的研究试验中,梅奥诊所招募了名患者,并要求他们使用由BeyondVerbal开发的应用程序产生三个短语音记录。研究人员使用机器学习分析了这些声音,并且成功识别了13个与冠状动脉疾病风险相关的声音特征。
“和声音频率相关的一个特征与患有冠状动脉疾病的相关性最高。”梅奥诊所的心脏病专家及医学教授阿米尔·莱尔曼说,“这种声音特征对人耳来说是不可辨别的,只能使用应用软件来拾取。”他还说道,“我们发现,那些利用血管造影所发现的血管阻塞的量或程度,甚至都可以在声音的特定部分被预测出来。”
莱尔曼说,智能手机上的声音测试应用程序可以作为低成本的预测性筛查工具,以识别那些最易患心脏病的患者。同时,这些软件还可以用于心脏手术后远程监测患者。例如,声音的变化可以指示患者是否已经停止服用他们的药物。
“下一个梅奥”计划将在中国进行一项类似的研究,以确定在初始研究中发现的语音特征是否在不同的语言中也是相通的。
现在,位于波士顿的SondeHealth公司首席执行官吉姆·哈珀已经看到了这项技术将会带来的经济价值,他们目前正在使用该语音测试技术对产妇的产后抑郁症、老年痴呆症、帕金森和其他老年性疾病进行监测。目前,SondeHealth医院和保险公司合作,试图建立AI平台以开展相关试验性研究,在该平台上,机器通过检测声音的声学变化自动诊断用户精神健康状况。