新版:语音(同步语音)的韵律特征与母语特征的比较
myprosod的Python项目详细描述
***version-20 release:如果口语能力级别的功能不起作用,则需要在计算机上执行ML。请与我联系以获取mltraining.py和相关的
数据集***
**version-10版本:添加了两个新功能***
韵律学是研究语音的音调和节奏,以及这些特征是如何产生意义的。
韵律学是研究语音的那些方面,这些方面通常适用于高于个人音素的水平,并且非常经常地适用于单词序列(在韵律短语中)。音素水平
(或“段”)以上的特征称为超段。
韵律的语音研究是对语音的超段特征的研究。在语音层面,
韵律的特征是:
1.声调(基频)
2.声强
3.节奏(音素和音节持续时间)
myprosody是一个python库,用于测量语音(同步语音,高熵)
与母语语音相比的声学特征。利用机器学习算法观察并建立了母语语音模式的声学特征。一种声学模型(算法)可以中断记录的语音
(分别为48khz&32位采样率和位深),并检测音节边界、基频
轮廓和共振峰。它的内置功能识别/测量:
频率)
f0分位数u25分位数指数
f0分位数u50分位数指数
f0分位数u75分位数指数
f0标准
f0最大
f0最小
no.检测到的u元音
perc%.正确的u元音
(f2/f1)平均值(第一和第二共振峰频数)
(f2/f1)字数
停顿次数
语调指数
(语音合成计数)/(停顿次数
托福量表分数
评分香农指数
说话率
性别识别
语音语气(语义分析)
发音后验分数
发音率
语音率
单词
f0统计
----
新
----
水平(cefr水平)
韵律方面(比较,本族语水平)
图书馆是根据克劳斯·泽切纳等人提出的想法开发的,他在《英语口语测试》中对非本族语的自发言语进行了自动评分。言语交流卷
51-2009,Nivja Dejong和Ton Wempe[1],Paul Boersma和David Weenink[2],Carlo Gussenhoven[3],
S.M Witt和S.J.Young[4]以及yannick jadoul[5]。
强度峰值(db)在强度之前和之后的衰减被认为是潜在的音节核。
myprosody的目的是提供一个完整的定量和分析方法来研究语音的声学特征。此外,通过使用python的
功能,可以进一步分析这些特性,从而对语音模式提供更有趣的见解。
此库面向语言学家、科学家、开发人员、语音和语言治疗诊所和研究人员。
请注意,myprosody分析目前处于初始状态,但正在积极发展中。虽然目前存在的
功能量并不大,但在接下来的几个月里还会增加更多功能。
窗口:
pip安装myprosody
将您安装的版本更新到最新版本:
pip install-u myprosody
注意:
==
==
在安装myprosody之后,从https://github.com/shahabks/myprosody
myprosody
下载名为的文件夹并保存在您的计算机上。该文件夹包括音频文件文件夹,您将在其中保存音频文件
以供分析。
音频文件必须为*.wav格式,以48 kHz采样帧和24-32位分辨率录制。
请查看https://github.com/shahabks/myprosody上的
examples.pdf
myprosody由日本myolutions实验室开发。它是mysolutions lab新一代语音识别和声学及语言建模项目的一部分,计划通过添加更高级的功能来丰富myprosody的功能。
数据集***
**version-10版本:添加了两个新功能***
韵律学是研究语音的音调和节奏,以及这些特征是如何产生意义的。
韵律学是研究语音的那些方面,这些方面通常适用于高于个人音素的水平,并且非常经常地适用于单词序列(在韵律短语中)。音素水平
(或“段”)以上的特征称为超段。
韵律的语音研究是对语音的超段特征的研究。在语音层面,
韵律的特征是:
1.声调(基频)
2.声强
3.节奏(音素和音节持续时间)
myprosody是一个python库,用于测量语音(同步语音,高熵)
与母语语音相比的声学特征。利用机器学习算法观察并建立了母语语音模式的声学特征。一种声学模型(算法)可以中断记录的语音
(分别为48khz&32位采样率和位深),并检测音节边界、基频
轮廓和共振峰。它的内置功能识别/测量:
频率)
f0分位数u25分位数指数
f0分位数u50分位数指数
f0分位数u75分位数指数
f0标准
f0最大
f0最小
no.检测到的u元音
perc%.正确的u元音
(f2/f1)平均值(第一和第二共振峰频数)
(f2/f1)字数
停顿次数
语调指数
(语音合成计数)/(停顿次数
托福量表分数
评分香农指数
说话率
性别识别
语音语气(语义分析)
发音后验分数
发音率
语音率
单词
f0统计
----
新
----
水平(cefr水平)
韵律方面(比较,本族语水平)
图书馆是根据克劳斯·泽切纳等人提出的想法开发的,他在《英语口语测试》中对非本族语的自发言语进行了自动评分。言语交流卷
51-2009,Nivja Dejong和Ton Wempe[1],Paul Boersma和David Weenink[2],Carlo Gussenhoven[3],
S.M Witt和S.J.Young[4]以及yannick jadoul[5]。
强度峰值(db)在强度之前和之后的衰减被认为是潜在的音节核。
myprosody的目的是提供一个完整的定量和分析方法来研究语音的声学特征。此外,通过使用python的
功能,可以进一步分析这些特性,从而对语音模式提供更有趣的见解。
此库面向语言学家、科学家、开发人员、语音和语言治疗诊所和研究人员。
请注意,myprosody分析目前处于初始状态,但正在积极发展中。虽然目前存在的
功能量并不大,但在接下来的几个月里还会增加更多功能。
窗口:
pip安装myprosody
将您安装的版本更新到最新版本:
pip install-u myprosody
注意:
==
==
在安装myprosody之后,从https://github.com/shahabks/myprosody
myprosody
下载名为的文件夹并保存在您的计算机上。该文件夹包括音频文件文件夹,您将在其中保存音频文件
以供分析。
音频文件必须为*.wav格式,以48 kHz采样帧和24-32位分辨率录制。
请查看https://github.com/shahabks/myprosody上的
examples.pdf
myprosody由日本myolutions实验室开发。它是mysolutions lab新一代语音识别和声学及语言建模项目的一部分,计划通过添加更高级的功能来丰富myprosody的功能。