会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~

构音障碍检测方法、构音障碍检测装置以及程序

申请号 CN202280057302.5 申请日 2022-08-01 公开(公告)号 CN117915839A 公开(公告)日 2024-04-19
申请人 松下控股株式会社; 发明人 釜井孝浩; 樱井朗穗; 大毛胜统; 川见员令; 高畑翔吾; 长尾青空;
摘要 构音障碍 检测方法包括取得步骤(S3)和检测步骤(S5)。在取得步骤(S3)中,取得与受验者发出的语音相关的语音信息。在检测步骤(S5)中,基于通过对检测模型输入取得步骤(S3)中取得的语音信息所得的输出结果,来检测受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过 机器学习 的模型。
权利要求

1.一种构音障碍检测方法,其中,包括:
取得步骤,取得与受验者发出的语音相关的语音信息;以及
检测步骤,基于通过对检测模型输入所述取得步骤中取得的所述语音信息而得到的输出结果,来检测所述受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
2.根据权利要求1所述的构音障碍检测方法,其中,
所述语音信息包括通过所述受验者以规定的模式移动舌头而发出的特定音。
3.根据权利要求2所述的构音障碍检测方法,其中,
所述特定音是弹音。
4.根据权利要求2或3所述的构音障碍检测方法,其中,
所述语音信息包含短语,所述短语中,所述特定音与塞音连续。
5.根据权利要求4所述的构音障碍检测方法,其中,
所述语音信息包括多个所述短语,
还包括划分步骤,所述划分步骤从所述取得步骤中取得的所述语音信息中划分所述多个短语,
在所述检测步骤中,将所述划分步骤中划分出的所述多个短语中的每一个输入到所述检测模型。
6.根据权利要求5所述的构音障碍检测方法,其中,
在所述划分步骤中,基于作为所述语音信息的RMS包络或频谱图,对所述多个短语进行划分,所述RMS包络是均方根包络。
7.根据权利要求5所述的构音障碍检测方法,其中,
在所述划分步骤中,通过对划分模型输入所述取得步骤中取得的所述语音信息,对所述多个短语进行划分,所述划分模型是以将包括所述多个短语的语音作为输入并对所述多个短语进行划分的方式经过机器学习的模型。
8.根据权利要求1至3中任一项所述的构音障碍检测方法,其中,
所述检测模型是以复原与输入的健康人的语音相同的语音的方式经过机器学习的自编码器模型,
在所述检测步骤中,基于对所述检测模型输入的所述语音信息与从所述检测模型输出的语音信息之间的偏离程度,来检测所述受验者有无构音障碍。
9.根据权利要求1至3中任一项所述的构音障碍检测方法,其中,
还包括输出步骤,所述输出步骤输出所述检测步骤中检测到的与所述受验者有无构音障碍相关的检测信息。
10.根据权利要求1至3中任一项所述的构音障碍检测方法,其中,
还包括再现步骤,所述再现步骤将针对所述受验者发出的语音的样本语音再现给所述受验者。
11.一种程序,其中,
使一个以上的处理器执行权利要求1至3中任一项所述的构音障碍检测方法。
12.一种构音障碍检测装置,其中,具备:
取得部,取得与受验者发出的语音相关的语音信息;以及
检测部,基于通过对检测模型输入所述取得部所取得的所述语音信息而得到的输出结果,来检测所述受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。

说明书全文

构音障碍检测方法、构音障碍检测装置以及程序

技术领域

[0001] 本公开涉及用于检测受验者的构音障碍的构音障碍检测方法、构音障碍检测装置以及程序。

背景技术

[0002] 专利文献1公开了一种先期脑卒中险指标的检测系统。在该检测系统中,摄像机捕获受检者面部的视频,以评价其是否具有脑卒中风险指标。另外,在该检测系统中,处理器分析与由摄像机捕获的受检者面部的视频建立关联的处理后的图像数据。然后,在该检测系统中,处理器判断捕获到的图像数据是否提示颈动脉狭窄的先期指标。
[0003] 在先技术文献
[0004] 专利文献
[0005] 专利文献1:日本特表2016‑522730号公报发明内容
[0006] 发明要解决的问题
[0007] 本公开提供一种能够容易地检测受验者有无构音障碍而不给受验者带来负担的构音障碍检测方法、构音障碍检测装置以及程序。
[0008] 解决问题的手段
[0009] 本公开的一个方式的构音障碍检测方法包括取得步骤和检测步骤。在所述取得步骤中,取得与受验者发出的语音相关的语音信息。在所述检测步骤中,基于通过对检测模型输入所述取得步骤中取得的所述语音信息,来检测所述受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
[0010] 发明的效果
[0011] 根据本公开,具有能够容易地检测受验者有无构音障碍而不给受验者带来负担的优点。附图说明
[0012] 图1是关于脑卒中患者的特性的说明图。
[0013] 图2是表示健康人的语音波形和根据语音波形得到的梅尔频谱图(Mel‑spectrogram)的一例的图。
[0014] 图3是表示脑卒中患者的语音波形和根据语音波形得到的梅尔频谱图的一例的图。
[0015] 图4是表示实施方式的构音障碍检测装置的结构的一例的框图
[0016] 图5是表示说出了多个短语的健康人的语音波形和根据语音波形得到的梅尔频谱图的一例的图。
[0017] 图6是表示说出了多个短语的脑卒中患者的语音波形和根据语音波形得到的梅尔频谱图的一例的图。
[0018] 图7是表示说出了多个短语的脑卒中患者的语音波形和根据语音波形得到的梅尔频谱图的另一例的图。
[0019] 图8是表示根据说出了多个短语的健康人和脑卒中患者的语音波形得到的RMS包络的一例的图。
[0020] 图9是表示针对实施方式的构音障碍检测装置的划分模型的训练阶段的一例的图。
[0021] 图10是表示使用了实施方式的构音障碍检测装置的划分模型的推理阶段的一例的图。
[0022] 图11是表示针对实施方式的构音障碍检测装置的检测模型的训练阶段的一例的图。
[0023] 图12是表示使用了实施方式的构音障碍检测装置的检测模型的推理阶段的一例的图。
[0024] 图13是表示实施方式的构音障碍检测装置的动作例的流程图
[0025] 图14是表示实施方式的构音障碍检测装置以及构音障碍检测方法的概要的一例的图。
[0026] 图15是表示实施方式的构音障碍检测装置的动作的具体例的图。
[0027] 图16是表示实施方式的构音障碍检测装置的动作的另一具体例的图。

具体实施方式

[0028] (达到本公开的见解)
[0029] 以往,公知有通过分析拍摄受验者面部而得的图像来检测脑卒中的发作风险的技术,例如在专利文献1中公开了该技术。如上所述,在专利文献1所公开的检测系统中,用摄像机拍摄受验者面部的视频。然后,在该检测系统中,通过分析与受验者面部的视频建立关联的处理后的图像数据,判断拍摄到的图像数据是否提示作为脑卒中的一个风险要因的颈动脉狭窄的先期指标。
[0030] 然而,在专利文献1所公开的检测系统中,存在如下课题:必须用摄像机来拍摄受验者面部的视频,这往往会给不愿意被相机等拍摄的受验者带来沉重负担。
[0031] 另外,在专利文献1所公开的检测系统中,由于是对拍摄受验者面部所得的图像数据进行分析,因此受验者面部在图像数据中处于适当的位置或处于适当的度是重要的。因此,存在如下课题:在委托受验者用摄像机拍摄自己的面部的情况下,受验者必须花费一些努来得到适当的图像数据,这往往会给受验者带来沉重负担。
[0032] 因此,本申请发明人针对上述问题进行了深入研究,发现根据受验者发出的语音能够检测受验者有无构音障碍,换言之,能够检测在受验者从嘴说出单词时该单词的要素即音韵是否能够被正确发音。如后所述,受验者有无构音障碍可以表示受验者有无脑卒中发作前兆。因此,仅通过受验者发出语音就可以检测受验者有无脑卒中发作前兆。
[0033] 因此,根据本公开,能够提供与拍摄受验者面部的情况相比,易于检测受验者有无构音障碍进而易于检测受验者有无脑卒中发作前兆,而不会给受验者带来负担的构音障碍检测方法、构音障碍检测装置以及程序。
[0034] (本公开的概要)
[0035] 本公开的一个方式的概述如下。
[0036] 本公开的一个方式的构音障碍检测方法包括取得步骤和检测步骤。在所述取得步骤中,取得与受验者发出的语音相关的语音信息。在所述检测步骤中,基于通过对检测模型输入所述取得步骤中取得的所述语音信息,来检测所述受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
[0037] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,与委托受验者用摄像机拍摄自己的面部的情况相比,具有能够容易地检测受验者有无构音障碍而不给受验者带来负担的优点。
[0038] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,所述语音信息包括通过所述受验者以规定的模式移动舌头而发出的特定音。
[0039] 由此,具有如下优点:由于易于检测作为有无构音障碍的指标的舌头的麻痹程度,与语音信息不包含特定音的情况相比,易于检测受验者有无构音障碍。
[0040] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,所述特定音是弹音。
[0041] 由此,具有如下优点:通过将舌头麻痹的情况下难以发出的弹音包含在特定音中,更容易地检测受验者有无构音障碍。
[0042] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,所述语音信息包含短语,所述短语中,所述特定音与塞音连续。
[0043] 由此,具有如下优点:通过使受验者发出的语音中容易确定位置的塞音与特定音连续,易于确定受验者发出的语音中的特定音的位置,从而更容易地检测受验者有无构音障碍。
[0044] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,所述语音信息包括多个所述短语。另外,也可以是,本公开的一个方式的构音障碍检测方法还包括划分步骤,用于从所述取得步骤中取得的所述语音信息中划分所述多个短语。另外,也可以是,在所述检测步骤中,将所述划分步骤中划分出的所述多个短语中的每一个输入到所述检测模型。
[0045] 由此,具有如下优点:与根据单一的短语检测受验者有无构音障碍的情况相比,更容易地检测受验者有无构音障碍。
[0046] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,在所述划分步骤中,基于作为所述语音信息的RMS(Root Mean Square,均方根)包络或频谱图,对所述多个短语进行划分。
[0047] 由此,具有如下优点:在RMS包络或频谱图中容易出现可划分多个短语的特征,因此能够期待提高对多个短语进行划分的精度
[0048] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,在所述划分步骤中,通过对划分模型输入所述取得步骤中取得的所述语音信息,对所述多个短语进行划分,所述划分模型是以将包括所述多个短语的语音作为输入并对所述多个短语进行划分的方式经过机器学习的模型。
[0049] 由此,具有如下优点:与不使用划分模型对多个短语进行划分的情况相比,能够期待提高对多个短语进行划分的精度。另外,在存在大量训练数据的情况下,划分模型是深度神经网络(DNN:Deep Neural Network)模型,则能够期待精度提高。此外,在训练数据少的情况下,划分模型使用RMS包络作为语音信息,则能够期待精度提高。
[0050] 例如,也可以是,在本公开的一个方式的构音障碍检测方法中,所述检测模型是以复原与输入的健康人的语音相同的语音的方式经过机器学习的自编码器模型。另外,也可以是,在所述检测步骤中,基于对所述检测模型输入的所述语音信息与从所述检测模型输出的语音信息之间的偏离程度,来检测所述受验者有无构音障碍。
[0051] 由此,具有如下优点:与使用数量比健康人少的患有构音障碍的患者的语音来训练检测模型的情况相比,容易准备大量的训练数据,因此容易训练检测模型。
[0052] 例如,也可以是,本公开的一个方式的构音障碍检测方法还包括输出步骤,所述输出步骤输出所述检测步骤中检测到的与所述受验者有无构音障碍相关的检测信息。
[0053] 由此,具有如下优点:例如,通过对受验者输出检测信息,受验者能够掌握自己是否患有构音障碍。
[0054] 例如,也可以是,本公开的一个方式的构音障碍检测方法在所述取得步骤之前,还包括再现步骤,所述再现步骤将针对所述受验者发出的语音的样本语音再现给所述受验者。
[0055] 由此,具有如下优点:受验者能够尝试发声以再现样本语音,与显示字符串并催促受验者发声的情况相比,容易取得受验者的语音。另外,由此,具有如下优点:能够以包括受验者是否能够再现并说出样本语音的方式来检测受验者有无构音障碍,能够期待提高检测受验者有无构音障碍的精度。
[0056] 另外,本公开的一个方式的程序使一个以上的处理器执行上述构音障碍检测方法。
[0057] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,具有如下优点:与委托受验者用摄像机拍摄自己的面部的情况相比,能够容易地检测受验者有无构音障碍而不给受验者带来负担。
[0058] 此外,本公开的一个方式的构音障碍检测装置具备取得部和检测部。所述取得部取得与受验者发出的语音相关的语音信息。所述检测部基于通过对检测模型输入所述取得部所取得的所述语音信息而得到的输出结果,来检测所述受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
[0059] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,具有如下优点:与委托受验者用摄像机拍摄自己的面部的情况相比,能够容易地检测受验者有无构音障碍而不给受验者带来负担。
[0060] 此外,这些概括性的或具体的方式可以通过系统、方法、装置、集成电路计算机程序或计算机可读取的CD‑ROM等记录介质来实现,也可以通过系统、方法、装置、集成电路、计算机程序和记录介质的任意组合来实现。
[0061] 以下,参照附图具体说明本公开的实施方式。以下实施方式所示的数值、形状、材料、构成要素、构成要素的配置位置和连接形式、步骤、步骤的顺序等仅是一例,其主旨并非限定要请求保护的范围。另外,在以下的实施方式的构成要素中,将表示最上位概念的独立技术方案中未记载的构成要素记载为任意的构成要素。此外,各图不一定被严格地图示。在各图中,对实质上相同的结构赋予相同的附图标记,并省略或简化重复的说明。
[0062] (实施方式)
[0063] 以下,参照附图对实施方式进行具体说明。
[0064] [1.概要]
[0065] 首先,在说明本实施方式的构音障碍检测装置以及构音障碍检测方法时,对在受验者发出的语音中出现能够检测受验者有无构音障碍的特征这一见解进行概要说明。图1是关于脑卒中患者的特性的说明图。这里所说的脑卒中可以包括例如腔隙性脑梗塞或动脉粥样硬化血栓性脑梗塞等脑梗塞、或者脑出血等。图1示出了言语听力治疗师(Speech‑Language‑Hearing Therapist)通过聆听共计一百几十名脑卒中患者发出的共计一百几十个语音并进行了障碍发生部位的估计所得的结果。在图1中,横轴表示口腔中被诊断为发生麻痹的部位,纵轴表示受验者的数量。如图1所示,脑卒中患者的口腔经常发生麻痹。特别地,脑卒中患者被认为明显产生前舌、中舌和后舌之类的舌头麻痹。
[0066] 这里,为了确定受验者口腔中发生麻痹的部位,要求受验者说出测试短语,并由言语治疗师聆听该声音。作为测试短语,采用当受验者的口腔发生麻痹的情况下难以发声的短语,例如“瑠璃も玻璃も照らせば光る(ruri mo hari mo teraseba hikaru,意为“是金子在哪里都会发光”)”等。
[0067] 图2是表示健康人的语音波形和根据语音波形得到的频谱图的一例的图。图3是表示脑卒中患者的语音波形和根据语音波形得到的频谱图的一例的图。
[0068] 在图2和图3中,分别为上侧的区域A1表示语音波形,下侧的区域A2表示频谱图。这里所说的频谱图是经时表示的受验者声音的频谱。此外,图2和图3中所示的语音波形都是通过让受验者说出测试短语“瑠璃も玻璃も照らせば光る”并收集该语音而得到的波形。
[0069] 测试短语“瑠璃も玻璃も照らせば光る”中包含日语ラ(ra)行的辅音,而这样的辅音就是弹音。这里所说的弹音是指由口腔中的调音器官进行瞬间接触而产生的辅音,例如通过舌头仅非常短时间地接触硬腭而产生的声音。即,弹音是受验者通过以规定的模式移动舌头所发出的特定音。如果舌头麻痹,就很难正确地发音这样的特定音。
[0070] 在图2和图3中,空心箭头示出了测试短语中发出ラ行的辅音即弹音的位置。如图2所示,在根据健康人的语音波形而得到的梅尔频谱图中,在发出弹音的位置处在纵向上出现暗线状的区域B1。这样,在正确发出弹音的情况下,会在极短时间内(例如20毫秒以下)发生功率(power)的下降。
[0071] 另一方面,如图3所示,根据脑卒中患者的语音波形而得到的频谱图中,在发出弹音的位置处没有产生极短时间的功率的下降,即,没有在纵向上出现暗线状的区域B1(参照区域C1)。这样,在应该发出弹音的位置处没有正确地发出弹音,可以考虑原因可能是因为脑卒中患者的舌头发生了麻痹,舌头没有接触到硬腭。此外,功率的下降相对较弱的情况、或者功率的下降的发生时间相对较长的情况也可以说是没有正确地发出弹音。
[0072] 如上所述,在受验者发出的语音中,出现可以检测受验者的舌头是否发生麻痹的特征,换句话说,出现可以检测受验者有无构音障碍的特征。因此,通过分析受验者发出的语音中出现的特征,例如分析是否正确发出弹音,能够检测受验者有无构音障碍,进一步检测受验者有无脑卒中发作前兆。
[0073] [2.结构]
[0074] 接下来,对实施方式的构音障碍检测装置的结构以及构音障碍检测方法进行详细说明。图4是表示实施方式的构音障碍检测装置100的结构的一例的框图。在实施方式中,构音障碍检测装置100搭载于智能手机、平板终端等信息终端。当然,构音障碍检测装置100可以搭载在台式或膝上型个人计算机中。另外,构音障碍检测装置100也称为“构音障碍检测系统100”。
[0075] 如图4所示,构音障碍检测装置100具备取得部11、划分部12、检测部13、输出部14、再现部15以及存储部16。此外,存储部16中存放有划分模型17和检测模型18。在实施方式中,取得部11、划分部12、检测部13、输出部14以及再现部15均由搭载在信息终端或个人计算机中的处理器执行规定的程序来实现。
[0076] 取得部11取得与受验者发出的语音相关的语音信息。取得部11是构音障碍检测方法中的取得步骤的执行主体。取得部11通过用例如搭载于信息终端的麦克风收集受验者发出的语音并将收集到的语音转换为电信号,来取得语音信息。这里,语音信息可以包括受验者发出的语音的语音波形,或者通过对语音波形执行适当的信息处理而得到的信息。作为一例,语音信息可以包括根据语音波形得到的RMS(Root Mean Square:均方根)包络、或者语音波形的频谱图(包括梅尔频谱图)。
[0077] 在实施方式中,取得部11通过催促受验者发出包括多个短语的测试短语来取得包括多个短语的语音信息。这里所说的短语例如是弹音等受验者以规定的模式移动舌头而发出的特定音和塞音连续的短语。在实施方式中,短语是“dere”。也就是说,在实施方式中,催促受验者说出将上述短语反复多次的测试短语“derederedere...”。
[0078] 这样,在实施方式中,语音信息包括受验者以规定的模式移动舌头而发出的特定音。另外,在实施方式中,特定音为弹音。此外,在实施方式中,语音信息包含特定音和塞音连续的短语。此外,在实施方式中,语音信息包括多个短语。
[0079] 以下,说明采用“derederedere...”作为测试短语的原由。如上所述,如果测试短语包括例如弹音等特定音,则能够根据受验者发出的语音来检测受验者有无构音障碍。然而,为了分析受验者是否正确地发出了特定音,优选确定受验者发出的语音中应该发出特定音的位置。这是因为,例如,在脑卒中患者这样患有构音障碍的受验者说出了测试短语的情况下,如果不掌握应该发出特定音的位置,则不能判别是无法正确地发出特定音,还是原本就没有打算发出特定音。
[0080] 因此,本申请的发明人发现,采用受验者发出的语音中的位置相对容易确定的塞音和特定音连续的短语作为测试短语。塞音是从关闭两唇之间、舌尖和上牙槽之间、或后舌和软腭之间等而停止呼气的状态,突然打破该闭合时发出的声音(辅音)。与弹音相比,塞音即使在舌头麻痹的情况下也容易发音,而且由于发音时功率暂时下降,因此是相对容易确定受验者发出的语音中的位置。
[0081] 然后,如果能够确定受验者发出的语音中的塞音的位置,则还能够确定与塞音连续的特定音的位置。在实施方式中,采用“dere”作为塞音和特定音连续的短语。
[0082] 此外,通过采用多个短语即“derederedere...”而不是采用单个短语“dere”作为测试短语,谋求进一步提高检测受验者有无构音障碍的精度。也就是说,在受验者仅说出了单个短语即“dere”的情况下,例如脑卒中患者这样患有构音障碍的受验者可能也会偶然地正确发出特定音。另一方面,在受验者说出了多个短语即“derederedere...”的情况下,在至少一个以上的短语中患有构音障碍的受验者无法正确发出特定音的概率会提高,因此能够期待容易地检测受验者有无构音障碍。此外,由于重复多个短语会使对舌头运动的要求变得复杂,从而更清楚地出现构音障碍。
[0083] 图5是表示说出了多个短语的健康人的语音波形和根据语音波形得到的频谱图的一例的图。图6是表示说出了多个短语的脑卒中患者的语音波形和根据语音波形得到的频谱图的一例的图。图7是表示说出了多个短语的脑卒中患者的语音波形和根据语音波形得到的频谱图的另一例的图。
[0084] 在图5~图7的每一个中,上侧的区域A1表示语音波形,下侧的区域A2表示频谱图。此外,图5~图7所示的语音波形都是通过让受验者说出测试短语“derederedere...”并收集该语音而得到的波形。
[0085] 在图5~图7的每一个中,空心箭头示出了测试短语中“re”即发出弹音的位置。如图5所示,在根据健康人的语音波形而得到的频谱图中,在发出弹音的位置处正确发出弹音,因此在纵向上出现暗线状的区域B2,所述区域B2表示在极短时间的功率的下降。另一方面,如图6所示,在根据脑卒中患者的语音波形而得到的频谱图中,例如,如区域C2所示,在应该发出弹音的位置处,没有出现表示极短时间的功率的下降的在纵向上较长的暗线状的区域,未能正确发出弹音。此外,在图7所示的根据另一脑卒中患者的语音波形而得到的频谱图中,例如,如区域C3所示,在应该发出弹音的位置处,功率下降持续相对较长时间地出现,也未能正确发出弹音。
[0086] 另外,能够检测有无构音障碍的特征不仅可以在根据语音波形得到的频谱图中发现,还可以在根据语音波形得到的RMS包络中发现。图8是表示根据说出了多个短语的健康人和脑卒中患者的语音波形得到的RMS包络的一例的图。图8的(a)表示根据健康人的语音波形而得到的RMS包络。另一方面,图8的(b)、(c)、(d)均表示根据脑卒中患者的语音波形而得到的RMS包络。图8的(a)、(b)、(c)、(d)中的RMS包络都是对通过让受验者说出测试短语“derederedere...”并收集该语音而得到的语音波形执行适当的信息处理而得到的。
[0087] 如图8的(a)所示,在根据健康人的语音波形而得到的RMS包络中,每个短语的包络的形状是规则的,并且在每个短语的中央部可以看出正确发出弹音所引起的功率的轻微下降。另一方面,在图8的(b)所示的根据脑卒中患者的语音波形而得到的RMS包络中,每个短语的包络的形状是不规则的,并且在每个短语的中央部可以看出不能正确发出弹音所引起的功率的急剧下降。此外,在图8的(c)所示的根据另一脑卒中患者的语音波形得到的RMS包络中,同样地,每个短语的包络的形状是不规则的。此外,在图8的(d)所示的根据又一个脑卒中患者的语音波形得到的RMS包络中,同样地,每个短语的包络的形状是不规则的,并且短语的间隔也是不规则的。
[0088] 如上所述,通过采用“derederedere...”作为测试短语,在根据语音波形得到的频谱图和RMS包络中,都容易出现表示是否正确发出弹音的特征。
[0089] 划分部12从由取得部11(取得步骤)取得的语音信息中对多个短语进行划分。划分部12是构音障碍检测方法中的划分步骤的执行主体。具体地,受验者发出的测试短语是将如上所述的短语“dere”多次重复而得到的语音“derederedere...”,因此包括多个短语。划分部12将该多个短语“derederedere...”逐个划分为短语“dere”,从而使得用后述的检测部13易于处理语音信息。
[0090] 在实施方式中,划分部12(划分步骤)基于作为语音信息的RMS包络或频谱图(这里是梅尔频谱图),来对多个短语进行划分。此外,在实施方式中,划分部12(划分步骤)通过对划分模型17输入由取得部11(取得步骤)取得的语音信息,来对多个短语进行划分。划分模型17是以包括多个短语的语音为输入并对多个短语进行划分的方式经过机器学习的已训练模型。
[0091] 具体地,划分模型17例如是深度神经网络(Deep Neural Network:DNN)模型,并且是序列标注模型(sequence labeling model)。划分模型17将根据包括多个短语的语音波形得到的RMS包络或频谱图作为输入,并且输出标注数据。标注数据是表示每个是否属于短语的二值信息的集合。例如,在根据语音波形得到100帧的RMS包络或频谱图的情况下,标注数据是100帧的二值信息的集合。
[0092] 划分部12基于从划分模型17输出的标注数据,生成并输出划分信息。例如,如果标注数据是“11...100111...”,则“1”的连续数据表示短语,“0”表示相邻短语之间的中断。因此,划分部12基于标注数据生成包括多个短语中的各个短语的开始位置和结束位置的划分信息。
[0093] 以下,使用图9说明划分模型17的训练阶段的具体例。图9是表示实施方式的构音障碍检测装置100的划分模型17的训练阶段的一例的图。首先,取得部11通过对收集到的语音波形执行适当的信息处理,从语音波形取得RMS包络或梅尔频谱图作为语音信息。图9所示的例子图示了梅尔频谱图的一例。
[0094] 根据语音波形得到的RMS包络具有维度数“α”(α=1)和帧数“p”(p是自然数)。此外,根据语音波形得到的梅尔频谱图具有维度数“β”(β是自然数,且β>1)和帧数“p”。这里所说的维度数示出了沿频率轴的功率分辨率。另外,这里所说的帧数示出了通过将语音波形按每单位时间截取而得的帧的数量。
[0095] 接下来,将取得部11取得的语音信息输入到机器学习尚未完成的划分模型17(以下,称为“未完成的划分模型17”)。由此,未完成的划分模型17输出标注数据。该标注数据具有维度数“1”和帧数“p”。
[0096] 然后,将未完成的划分模型17输出的标注数据和正确答案数据输入到损失函数(这里为多分类交叉熵误差(Categorical Cross Entropy Error)函数),并执行误差反向传播法(Backpropagation)以使损失函数的输出为最小值,从而使得未完成的划分模型17通过有监督学习进行机器学习。正确答案数据是根据通过让健康人说出测试短语而得到的语音波形事先制作的标注数据。正确答案数据与未完成的划分模型17输出的标注数据同样地,具有维度数“1”和帧数“p”。
[0097] 以下,使用图10说明使用已完成机器学习的划分模型17的推理阶段的具体例。图10是表示使用实施方式的构音障碍检测装置100的划分模型17的推理阶段的一例的图。首先,取得部11通过对收集到的语音波形执行适当的信息处理,根据语音波形取得RMS包络或梅尔频谱图作为语音信息。在图10所示的例子中,图示了梅尔频谱图的一例。此外,RMS包络和梅尔频谱图的帧数与训练阶段相同。此外,RMS包络和梅尔频谱图的维度数也与训练阶段相同。
[0098] 接下来,划分部12将取得部11取得的语音信息输入到划分模型17中。由此,划分模型17输出标注数据。然后,划分部12基于划分模型17输出的标注数据,生成包括多个短语中的各个短语的开始位置和结束位置的划分信息。划分部12生成的划分信息由后述的检测部13使用。
[0099] 检测部13基于通过对检测模型18输入由取得部11(取得步骤)取得的语音信息而得到的输出结果,检测受验者有无构音障碍。检测部13是构音障碍检测方法中的检测步骤的执行主体。在实施方式中,检测部13(检测步骤)将由划分部12(划分步骤)划分出的多个短语中的各个短语输入到检测模型18。即,在实施方式中,取得部11(取得步骤)取得的语音信息不直接输入到检测模型18,而是将划分后的多个短语作为语音信息间接输入到检测模型18。
[0100] 检测模型18是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。具体地,检测模型18例如是卷积神经网络(Convolutional Neural Network:CNN)模型,并且是以复原与输入的健康人的语音相同的语音的方式经过机器学习的自编码器模型。例如,检测模型18将由划分部12划分的多个短语中的各个短语的RMS包络或梅尔频谱图作为输入,尝试复原这些短语,并输出与多个短语中的每一个对应的RMS包络或梅尔频谱图。
[0101] 然后,检测部13(检测步骤)基于输入到检测模型18的语音信息和从检测模型18输出的语音信息之间的偏离程度,来检测受验者有无构音障碍。例如,当关于健康人的语音信息被输入到检测模型18时,将复原并输出与输入的语音信息几乎相同的语音信息。在这种情况下,偏离程度是相对小的。另一方面,当关于脑卒中患者这样的患有构音障碍的受验者的语音信息被输入到检测模型18时,检测模型18无法复原该语音信息,输出与输入的语音信息不同的语音信息。在该情况下,偏离程度是相对大的。
[0102] 因此,检测部13基于输入到检测模型18的输入数据与从检测模型18输出的输出数据之间的偏离程度,生成关于受验者有无构音障碍的检测信息。例如,检测部13计算输入到检测模型18的输入数据与从检测模型18输出的输出数据之间的均方误差(Mean Squared Error)。然后,检测部13如果计算出的均方误差超过阈值,则检测为受验者患有构音障碍,若为阈值以下,则检测为受验者没有构音障碍,是健康人。
[0103] 以下,使用图11说明检测模型18的训练阶段的具体例。图11是表示关于实施方式的构音障碍检测装置100的检测模型18的训练阶段的一例的图。首先,取得部11通过对收集到的语音波形执行适当的信息处理,根据语音波形取得梅尔频谱图作为语音信息。
[0104] 根据语音波形得到的梅尔频谱图的维度数为“γ”(γ为自然数,且β≠γ),帧数为“q”(q为自然数,且q≠p)。
[0105] 接下来,检测部13通过参照划分部12输出的划分信息,将取得部11取得的语音信息划分为多个短语,从而生成仅由多个短语构成的划分数据。划分数据的维度数为“γ”,划分数据的帧数为“r”(r为自然数,且r
[0106] 接下来,将划分数据输入到机器学习尚未完成的检测模型18(以下称为“未完成的检测模型18”)。由此,未完成的检测模型18输出通过尝试复原输入的划分数据而得到的复原数据。与划分数据同样地,该复原数据具有维度数“γ”和帧数“r’”。
[0107] 然后,将划分数据和未完成的检测模型18输出的复原数据输入到损失函数(这里为均方误差函数)并执行误差反向传播方法以使损失函数的输出为最小值,从而使得未完成的检测模型18通过无监督学习进行机器学习。
[0108] 以下,使用图12说明使用已完成机器学习的检测模型18的推理阶段的具体例。图12是表示使用实施方式的构音障碍检测装置100的检测模型18的推理阶段的一例的图。首先,取得部11通过对所收集的语音波形执行适当的信息处理,根据语音波形取得梅尔频谱图作为语音信息。在图12所示的例子中,示出了梅尔频谱图的一例。另外,梅尔频谱图的维度数和帧数均与训练阶段相同。
[0109] 接下来,检测部13通过参照划分部12输出的划分信息,将取得部11取得的语音信息划分为多个短语,生成未整形的划分数据。接下来,检测部13通过重新调整划分数据中包括的多个短语的尺寸来生成划分数据。
[0110] 接下来,检测部13将生成的划分数据输入到检测模型18。由此,检测模型18输出复原数据。然后,检测部13计算输入到检测模型18的划分数据与检测模型18输出的复原数据之间的均方误差,并将计算出的均方误差与阈值进行比较,从而生成关于受验者有无构音障碍的检测信息。由检测部13生成的检测信息由后述的输出部14使用。
[0111] 另外,在实施方式中,根据语音波形得到的梅尔频谱图在检测模型18的训练阶段和使用检测模型18的推理阶段均被用作语音信息,根据语音波形得到的RMS包络可以被用作语音信息。
[0112] 此外,检测部13并不将所有划分数据输入到检测模型18,而是将划分数据的一部分输入到检测模型18,例如通过去除划分数据中包括的多个短语中的最后一个短语等。这是因为,受验者可能直到最后都不能确实说出测试短语,在这种情况下最后的短语对于检测模型18来说是噪声。
[0113] 输出部14输出由检测部13(检测步骤)检测出的关于受验者有无构音障碍的检测信息。输出部14是构音障碍检测方法中的输出步骤的执行主体。检测信息可以包括表示受验者是否患有构音障碍的信息。在实施方式中,检测信息包括表示受验者有无脑卒中发作前兆的信息,该前兆与受验者有无构音障碍相关。输出部14通过在信息终端的显示器上显示例如表示检测信息的字符串或图像等来输出检测信息。
[0114] 在取得部11取得语音信息之前(取得步骤之前),再现部15将针对受验者发出的语音的样本语音再现给受验者。再现部15是构音障碍检测方法中的再现步骤的执行主体。样本语音例如是机械语音,且是以规定的音量和规定的节奏读出测试短语的语音。再现部15例如以受验者在信息终端上进行规定的操作为触发,并且从搭载在信息终端中的扬声器再现样本语音。
[0115] 存储部16是存储取得部11、划分部12、检测部13、输出部14和再现部15执行各种处理所需的信息(计算机程序等)的存储装置。存储部16例如由半导体存储器实现,但是没有特别限定,能够使用公知的电子信息存储的装置。存储部16存放有划分部12使用的划分模型17和检测部13使用的检测模型18。
[0116] [3.动作]
[0117] 以下,使用图13~图15说明实施方式的构音障碍检测装置100的动作(即,构音障碍检测方法)的一例。图13是表示实施方式的构音障碍检测装置100的动作例的流程图。图14是表示实施方式的构音障碍检测装置100以及构音障碍检测方法的概要的一例的图。图
15是表示实施方式的构音障碍检测装置100的动作的具体例的图。
[0118] 在下文中,如图14所示,以划分模型17和检测模型18都已经通过说明过的方法预先进行了机器学习的情况来进行说明。此外,在下文中,以受验者2过去曾脑卒中发作过,并且当前时间点尚未完全从脑卒中中康复的轻度患者的情况来进行说明。当然,受验者2也可以是过去从未脑卒中发作过的人。
[0119] 图15的(a)~(d)均表示信息终端3上的被称为“脑卒中复发检查器”的应用程序的执行流程。图15的(a)表示在该应用启动时在信息终端3的显示器31上显示的图像。在显示器31的中央,显示包含字符串“通过单词来检查”的图标41。受验者2用手指触摸图标41等来进行选择图标41的操作,从而向图15的(b)所示的流程转移。
[0120] 如图15的(b)所示,在信息终端3的显示器31上,显示有“请像下面这样说”这样催促受验者2说出测试短语的字符串M1和“derederederederedere”这样表示测试短语的字符串M2。此外,在显示器31上,与字符串M1、M2一起显示包括字符串“听示范”的图标42和包括字符串“开始检查”的图标43。
[0121] 这里,受验者2选择图标42的操作相当于图13所示的“再现触发”。即,当受验者2进行选择图标42的操作,换句话说存在再现触发时(S1:是),再现部15(再现步骤)再现样本语音(S2)。另外,在显示器31上显示图标42的定时不限于在取得语音信息之前,也可以在取得语音信息之后。例如,在由于受验者2发出的声音的音量较小等某种原因而无法检测受验者2的测试短语的情况下,可以在显示器31上显示图标42。此外,例如,当不能执行后述的步骤S4中从语音信息划分多个短语的处理时,可以在显示器31上显示图标42。另外,例如,在无法执行后述的步骤S5中的检测有无构音障碍的处理的情况下,也可以在显示器31上显示图标42。
[0122] 当受验者2没有进行选择图标42的操作(S2:否)或者受验者2在进行了选择图标42的操作之后受验者2进行了选择图标43,则接下来的处理移动到15的(c)所示的流程。注意,图标43可以是在受验者2进行了选择图标42的操作并再现样本语音之后受理由受验者2进行的操作(即,变得主动)的方式。在这种情况下,在受验者2听到样本语音之前不能向图15的(c)所示的流程转移。图标43也可以以如下方式来显示:在样本语音被再现之前,例如以用灰色来显示等表示不活跃的方式被显示,当样本语音被再现时,例如以用白色来显示等表示活跃的方式被显示。
[0123] 如图15的(c)所示,字符串M1、M2继续显示在信息终端3的显示器31上。此外,在显示器31上,与字符串M1、M2一起显示表示正在录音由受验者2说出的测试短语的子图像5、以及包括字符串“判定”的图标44。子图像5显示字符串“录音中”和由信息终端3的麦克风收集到的语音波形。即,在图15的(c)所示的流程中,取得部11(取得步骤)取得语音信息(S3)。
[0124] 接下来,当受验者2进行选择图标44的操作时,开始判定(检测)受验者2有无构音障碍的一系列处理。首先,划分部12(划分步骤)根据由取得部11(取得步骤)取得的语音信息中对多个短语进行划分(S4)。接下来,检测部13(检测步骤)将由划分部12(划分步骤)划分后的多个短语中的每一个输入到检测模型18中,由此检测受验者2有无构音障碍(S5)。然后,输出部14输出由检测部13(检测步骤)检测出的关于受验者2有无构音障碍的检测信息(S6)。具体而言,如图15的(d)所示,检测信息作为字符串M3显示在信息终端3的显示器31上。这里,作为在对受验者2检测到构音障碍的情况下的检测信息,换言之,作为在受验者2有脑卒中发作前兆的情况下的检测信息,显示有字符串M3“有脑卒中复发的可能性。建议找专科医生就诊。”。另外,在受验者2没有构音障碍的情况下,换言之,在受验者2没有脑卒中发作前兆的情况下,在显示器31上例如显示“无特别异常。”等字符串。
[0125] 另外,检测信息也可以例如以图16所示的形式显示在信息终端3的显示器31上。图16是表示实施方式的构音障碍检测装置100的动作的另一具体例的图。
[0126] 在图16的(a)所示的例子中,检测信息作为字符串M3和第一图表6显示在显示器31上。第一图表6表示根据受验者2的语音波形得到的RMS包络,包括受验者2不能正确发声短语而失败(换言之,被认定为构音障碍)的失败区间61。通过查看第一图表6,受验者2能够理解自己无法正确进行哪些短语的发声。
[0127] 在图16的(b)所示的例子中,检测信息在显示器31上显示为字符串M3、第一图表6、以及字符串M4“失败率为38%”。字符串M4提示失败区间61占受验者2发出语音的整个区间的比例(即失败率)。通过查看字符串M4,受验者2能够掌握脑卒中复发的可能性有多高。
[0128] 在图16的(c)所示的例子中,检测信息在显示器31上显示为字符串M3和第二图表7。第二图表7是按时间顺序表示失败率的条形图。这里,第二图表7示出了从8月1日到8月11日期间连续每天执行“脑卒中复发检查器”的结果。第二图表7中的平线71表示阈值,当失败率超过该阈值时,表示脑卒中复发的可能性高。通过查看第二图表7,受验者2能够按时间顺序掌握脑卒中复发的可能性有多高。
[0129] 如上所述,在实施方式的构音障碍检测装置100以及构音障碍检测方法中,不依靠医生或言语治疗师等专家,就能够根据受验者2发出的语音来检测有无构音障碍、进而检测有无脑卒中发作前兆。因此,通过使用实施方式的构音障碍检测装置100和构音障碍检测方法,如果受验者2有脑卒中发作前兆,则能够期待催促受验者2及早就医,从而通过及时治疗来防止病情加重。
[0130] [4.效果等]
[0131] 如上所述,实施方式的构音障碍检测方法包括取得步骤(S3)和检测步骤(S5)。在取得步骤(S3)中,取得与受验者发出的语音相关的语音信息。在检测步骤(S5)中,基于通过对检测模型18输入取得步骤(S3)中取得的语音信息所得的输出结果,来检测受验者有无构音障碍,所述检测模型是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
[0132] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,具有如下优点:与委托受验者用摄像机拍摄自己的面部的情况相比,能够容易地检测受验者有无构音障碍而不给受验者带来负担。
[0133] 此外,在实施方式的构音障碍检测方法中,语音信息包括通过受验者以规定的模式移动舌头而发出的特定音。
[0134] 由此,具有如下优点:由于易于检测作为有无构音障碍的指标的舌头的麻痹程度,与语音信息不包含特定音的情况相比,易于检测受验者有无构音障碍。
[0135] 此外,在实施方式的构音障碍检测方法中,特定音是弹音。
[0136] 由此,具有如下优点:通过将舌头麻痹的情况下难以发出的弹音包含在特定音中,更容易地检测受验者有无构音障碍。
[0137] 此外,在实施方式的构音障碍检测方法中,语音信息包含特定音和塞音连续的短语。
[0138] 由此,具有如下优点:通过使受验者发出的语音中容易确定位置的塞音与特定音连续,易于确定受验者发出的语音中的特定音的位置,从而更容易地检测受验者有无构音障碍。
[0139] 此外,在实施方式的构音障碍检测方法中,语音信息包括多个短语。另外,实施方式的构音障碍检测方法还包括划分步骤(S4),该划分步骤根据取得步骤(S3)中取得的语音信息对多个短语进行划分。此外,在检测步骤(S5)中,将划分步骤(S4)中划分出的多个短语中的每一个输入到检测模型18。
[0140] 由此,具有如下优点:与根据单一的短语检测受验者有无构音障碍的情况相比,更容易地检测受验者有无构音障碍。
[0141] 此外,在实施方式的构音障碍检测方法中,在划分步骤(S4)中,基于作为语音信息的RMS(Root Mean Square,均方根)包络或频谱图来划分多个短语。
[0142] 由此,具有如下优点:在RMS包络或频谱图中容易出现可划分多个短语的特征,因此能够期待提高对多个短语进行划分的精度。
[0143] 此外,在实施方式的构音障碍检测方法中,在划分步骤(S4)中,通过对划分模型17输入取得步骤(S3)中取得的语音信息,来划分多个短语,所述划分模型17是以将包括多个短语的语音作为输入并对多个短语进行划分的方式经过机器学习的模型。
[0144] 由此,具有如下优点:与不使用划分模型17对多个短语进行划分的情况相比,能够期待提高对多个短语进行划分的精度。
[0145] 此外,在实施方式的构音障碍检测方法中,检测模型18是以复原与输入的健康人的语音相同的语音的方式经过机器学习的自编码器模型。另外,在检测步骤(S5)中,,基于对检测模型18输入的语音信息与从检测模型18输出的语音信息之间的偏离程度,来检测受验者有无构音障碍。
[0146] 由此,具有如下优点:与使用数量比健康人少的患有构音障碍的患者的语音来训练检测模型18的情况相比,容易准备大量的训练数据,因此容易训练检测模型18。
[0147] 另外,在实施方式的构音障碍检测方法中,还包括输出步骤(S6),该输出步骤(S6)输出检测步骤(S5)中检测到的关于受验者有无构音障碍的检测信息。
[0148] 由此,具有如下优点:例如,通过对受验者输出检测信息,受验者能够掌握自己是否患有构音障碍。
[0149] 此外,在实施方式的构音障碍检测方法中,在取得步骤(S3)之前还包括再现步骤(S2),将受验者发出的语音的样本语音再现给受验者。
[0150] 由此,具有如下优点:能够检测受验者有无构音障碍,包括受验者是否能够再现并发出样本语音,能够期待提高检测受验者有无构音障碍的精度。
[0151] 另外,在实施方式的构音障碍检测装置100中,具备取得部11和检测部13。取得部11取得与受验者发出的语音相关的语音信息。检测部13基于通过对检测模型18输入由取得部11取得的语音信息而得到的输出结果,来检测受验者有无构音障碍,所述检测模型18是以将语音作为输入并输出与有无构音障碍相关的信息的方式经过机器学习的模型。
[0152] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,具有如下优点:与委托受验者用摄像机拍摄自己的面部的情况相比,能够容易地检测受验者有无构音障碍而不给受验者带来负担。
[0153] (其他实施方式)
[0154] 以上,基于上述实施方式说明了本公开的一个或多个方式的构音障碍检测方法和构音障碍检测装置100,但是本公开不限定于这些实施方式。除非脱离本公开的主旨,否则对实施方式施加本领域技术人员能够想到的各种变形所得的方式、通过组合不同实施方式中的构成要素而构成的方式也都可以包括在本公开的一个或多个方式的范围内。
[0155] 例如,在上述实施方式中,划分部12(划分步骤)使用划分模型17划分多个短语,但不限于此。例如,划分部12(划分步骤)也可以以在根据受验者的语音波形得到的RMS包络中功率为规定值以下的部位进行划分的方式来划分多个短语。在这种情况下,划分模型17不是必需的。
[0156] 例如,在上述实施方式中,采用多个短语作为受验者要说出的测试短语(即,取得部11取得的语音信息),也可以使用单个短语。在这种情况下,不需要划分部12(划分步骤)。
[0157] 此外,在上述实施方式中,采用“derederedere...”作为受验者要说出的测试短语(即,取得部11取得的语音信息),但不限于此,可以是塞音和弹音连续的短语。此外,测试短语不限于塞音和弹音连续的短语,可以是例如仅由弹音构成的短语。此外,根据检测模型18的学习方法,测试短语可以不包括弹音,甚至可以不包括通过以规定的模式移动舌头而发出的特定音。
[0158] 另外,在上述实施方式中,构音障碍检测装置100搭载于信息终端,但不限于此。例如,构音障碍检测装置100可以搭载于服务器装置。服务器装置可以是端服务器,也可以是本地服务器。在这种情况下,构音障碍检测装置100由搭载于服务器装置的处理器执行规定的程序来实现。另外,在该情况下,受验者也可以使用信息终端,通过网络等访问服务器装置。另外,例如,构音障碍检测装置100也可以是将其一部分结构搭载于信息终端、将剩余的结构搭载于服务器装置的结构。
[0159] 另外,构音障碍检测装置100也可以不存放在智能手机、平板终端等通用信息终端中,而存放在作为具有构音障碍检测功能的专用终端的装置中。在这种情况下,构音障碍检测装置100通过搭载在作为上述专用终端的装置中的处理器执行规定的程序来实现。
[0160] 例如,上述实施方式的构音障碍检测装置100所具备的构成要素的一部分或全部也可以由一个系统LSI(Large Scale Integration:大规模集成电路)构成。系统LSI是将多个结构部集成在一个芯片上而制造的超多功能LSI,具体而言,是包括微处理器、ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)等而构成的计算机系统。计算机程序存储在ROM中。系统LSI通过微处理器按照计算机程序进行动作来实现其功能。
[0161] 另外,这里虽然称为系统LSI,但根据集成度,也可以称为IC(Integrated Circuit,集成电路)、LSI、超级LSI、以及超大规模LSI。另外,电路集成化的方法不限于LSI,也可以使用专用电路或通用处理器来实现。可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array,现场可编程阵列)或者能够重构LSI内部的电路单元的连接和设定的可重构处理器。
[0162] 此外,如果由于半导体技术的进步或派生的其他技术而出现了取代LSI的集成电路技术,则自然可以使用该技术来进行功能的集成。生物技术的应用等也是可能的。
[0163] 另外,本公开的一个方式也可以是使计算机执行构音障碍检测方法中包含的各特征性步骤的计算机程序。此外,本公开的一个方式可以是记录有这样的计算机程序的计算机可读取的非暂时性记录介质。即,程序可以使一个以上的处理器执行上述构音障碍检测方法。
[0164] 由此,仅通过受验者发出语音就能够检测受验者有无构音障碍。因此,具有如下优点:与委托受验者用摄像机拍摄自己的面部的情况相比,能够容易地检测受验者有无构音障碍而不给受验者带来负担。
[0165] 产业上的可利用性
[0166] 本公开能够利用于例如用于判定有无脑卒中发作前兆的方法等。
[0167] 附图标记说明
[0168] 100 构音障碍检测装置
[0169] 11 取得部
[0170] 12 划分部
[0171] 13 检测部
[0172] 14 输出部
[0173] 15 再现部
[0174] 16 存储部
[0175] 17 划分模型
[0176] 18 检测模型
[0177] 2 受验者
[0178] 3 信息终端
[0179] 31 显示器
[0180] 41~44 图标
[0181] 5 子图像
[0182] 6 第一曲线
[0183] 61 失败区间
[0184] 7 第二曲线
[0185] 71 水平线
[0186] A1、A2、B1、B2、C1~C3 区域
[0187] M1~M4 字符串