腾讯云智聆口语评测音频数据评测说明-教育服务解决方案
对音频数据进行 base64 转换,进行评测。
声明并定义对象
@property (strong, nonatomic) TAIOralEvaluation *oralEvaluation;self.oralEvaluation = [[TAIOralEvaluation alloc] init];self.oralEvaluation.delegate = self;
设置数据回调
-(void)oralEvaluation:(TAIOralEvaluation *)oralEvaluation onEvaluateData:(TAIOralEvaluationData *)data result:(TAIOralEvaluationRet *)result error:(TAIError *)error { //数据和结果回调(只有data.bEnd为YES,result有效) }
注意 请在开始录制音频前设置回调函数,您将通过回调函数获取语音评测结果和错误信息。
初始化参数
初始化 TAIOraEvaluation 对象,并通过实例化对象 param 设置评测文本、客户 ID、密码等信息,详细参数信息请查看下文参数说明。注意建议用户使用子账号密钥 + 环境变量的方式调用 SDK,提高 SDK 使用的安全性。为子账号授权时,请遵循 最小权限指引原则,防止泄漏其他资源。如果您一定要使用永久密钥,建议遵循 最小权限指引原则 对永久密钥的权限范围进行限制。
//三、初始化参数TAIOralEvaluationParam *param = [[TAIOralEvaluationParam alloc] init];param.sessionId = [[NSUUID UUID] UUIDString];param.appId = @"";param.workMode = TAIOralEvaluationWorkMode_Once;param.evalMode = TAIOralEvaluationEvalMode_Sentence;param.storageMode = TAIOralEvaluationStorageMode_Disable;param.serverType = TAIOralEvaluationServerType_English;param.scoreCoeff = 1.0;param.fileType = TAIOralEvaluationFileType_Mp3;param.refText = @"";param.secretId = @""; // 用户的 SecretId,建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考https://cloud.tencent.com/document/product/598/37140param.secretKey = @""; // 用户的 SecretKey,建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考https://cloud.tencent.com/document/product/598/37140param.refText = @"";param.keyword = @"";
传输数据
本地音频数据
获取本地音频数据,由用户控制分片逻辑,对本地音频文件进行评测。
NSString *mp3Path = [[NSBundle mainBundle] pathForResource:@"hello_guagua" ofType:@"mp3"];TAIOralEvaluationData *data = [[TAIOralEvaluationData alloc] init];data.seqId = 1;data.bEnd = YES;data.audio = [NSData dataWithContentsOfFile:mp3Path];__weak typeof(self) ws = self;[self.oralEvaluation oralEvaluation:param data:data callback:^(TAIError *error) { [ws setResponse:[NSString stringWithFormat:@"oralEvaluation:%@", error]];}];
本地音频文件路径
获取本地音频文件路径,由 SDK 内部控制分片逻辑,对本地音频文件进行评测。
NSString *path = [[NSBundle mainBundle] pathForResource:@"test" ofType:@"mp3"];NSLog(@"path = %@", path);__weak typeof(self) ws = self;[self.oralEvaluation oralEvaluation:param path:path callback:^(TAIError *error) { [ws setResponse:[NSString stringWithFormat:@"oralEvaluation:%@", error]];}];
参数说明
请求参数说明
TAIOralEvaluationParam 参数说明
相应参数详细说明见 发音数据传输接口附带初始化过程(常用实践) 文档。
参数 | 类型 | 必填 | 说明 |
fileType | TAIOralEvaluationFileType | 是 | 语音文件类型。 TAIOralEvaluationFileType_Raw: raw TAIOralEvaluationFileType_Wav:wavTAIOralEvaluationFileType.MP3:mp3 |
sessionId | NSString | 是 | 语音段唯一标识 |
refText | NSString | 是 | 被评估语音对应的文本。参考评估文本介绍 |
workMode | TAIOralEvaluationWorkMode | 是 | 语音输入模式 TAIOralEvaluationWorkMode.STREAM:流式分片 TAIOralEvaluationWorkMode.ONCE:非流式一次性评估 参考语音输入模式介绍 |
evalMode | TAIOralEvaluationEvalMode | 是 | 评测模式。 TAIOralEvaluationEvalMode.WORD :单词模式 TAIOralEvaluationEvalMode.SENTENCE:句子模式 TAIOralEvaluationEvalMode.PARAGRAPH:段落模式 TAIOralEvaluationEvalMode.FREE:自由说模式 TAIOralEvaluationEvalMode.WORD_FIX:单词音素纠错模式 TAIOralEvaluationEvalMode.SCENE:情景评测模式 TAIOralEvaluationEvalMode.MULTI_BRANCH:句子多分支评测模式 TAIOralEvaluationEvalMode.WORD_REALTIME:单词实时评测模式 TAIOralEvaluationEvalMode.SPELLING:拼音评测模式参考评测模式介绍 |
scoreCoeff | Float | 是 | 评价苛刻指数,取值为[1.0 – 4.0]范围内的浮点数,用于平滑不同年龄段的分数。参考苛刻指数介绍 |
soeAppId | NSString | 否 | 业务应用 ID,与账号应用 AppID 无关,是用来方便客户管理服务的参数。具体参考业务应用 ID 介绍 |
serverType | TAIOralEvaluationServerType | 是 | 评估语言 TAIOralEvaluationServerType.ENGLISH:英文(默认) TAIOralEvaluationServerType.CHINESE:中文 参考评测模式介绍 |
sentenceInfoEnable | Bool | 是 | 输出断句中间结果标识。 |
Keyword | NSString | 否 | 参考主题词和关键词 |
textMode | NSInteger | 否 | 输入文本模式。TAIOralEvaluationTextMode.NORMAL: 普通文本,TAIOralEvaluationTextMode.PHONEME:音素结构文本,参考音素标注 |
isFixOn | Bool | 是 | 用于设置是否开启单词映射 |
isQuery | BOOL | 否 | 查询标识。true:查询请求 |
isAsync | BOOL | 否 | 异步模式标识。false:同步模式;true:异步模式 |
serviceTimeoutTryTimes | NSInteger | 否 | 重试次数。使用查询标识的查询次数 |
serviceTimeoutWaitInterval | NSInteger | 否 | 重试时间间隔。使用查询标识的重试时间间隔 |
cosBuketUrl | NSString | 否 | 音频存储路径,将音频存储到cos桶中(1.2.3.112及以上版本支持)。使用参考音频存储路径 |
TAICommonParam(TAIOralEvaluationParam)参数说明
参数 | 类型 | 必填 | 说明 |
appid | NSString | 是 | 账号应用 ID,参考账号信息 |
timeout | NSInteger | 否 | 超时时间,默认30秒 |
secretId | NSString | 是 | 您在控制台获取的密钥 ID,临时授权凭证的 TmpSecretId |
secretKey | NSString | 是 | 您在控制台获取的密钥 Key,临时授权凭证的 TmpSecretKey |
token | NSString | 否 | 临时授权凭证的 Token,仅在使用临时授权凭证时需要设置此参数 |
TAIOralEvaluationData 参数说明
参数 | 类型 | 必填 | 说明 |
seqId | NSInteger | 是 | 流式数据包的序号。取值范围[1,3000]。 |
bEnd | BOOL | 是 | 是否传输完毕标志 |
audio | NSData | 是 | 音频数据 |
返回结果参数
TAIOralEvaluationRet 参数说明
参数 | 类型 | 说明 |
sessionId | NSString | 语音段唯一标识 |
requestId | NSString | 唯一请求 ID,每次请求都会返回 |
pronAccuracy | Float | 发音精准度,取值范围[-1, 100],当取-1时指完全不匹配 |
pronFluency | Float | 发音流利度,取值范围[0, 1],当为词模式时,取值无意义 |
pronCompletion | Float | 发音完整度,取值范围[0, 1],当为词模式时,取值无意义 |
words | NSArray | 单词详细发音评估结果 |
SuggestedScore | Float | 建议评分,取值范围[0,100] |
sentenceInfoSet | NSArray | 断句中间结果,待用户发音完全结束后,系统会给出一个综合所有句子的整体结果 |
refTextId | NSInteger | 匹配候选文本的序号,在句子多分支、情景对 话、段落模式下表示匹配到的文本序号注意:此字段可能返回 null,表示取不到有效值。 |
KeyWordHits | NSArray | 主题词命中标志,0表示没命中,1表示命中注意:此字段可能返回 null,表示取不到有效值。 |
UnKeyWordHits | NSArray | 负向主题词命中标志,0表示没命中,1表示命中注意:此字段可能返回 null,表示取不到有效值。 |
TAIOralEvaluationWord 参数说明
参数 | 类型 | 说明 |
beginTime | Int | 当前单词语音起始时间点,单位为ms |
endTime | Int | 当前单词语音终止时间点,单位为ms |
pronAccuracy | Float | 单词发音精准度,取值范围[-1, 100],当取-1时指完全不匹配 |
pronFluency | Float | 单词发音流利度,取值范围[0, 1] |
word | NSString | 当前词 |
matchTag | Int | 当前词与输入语句的匹配情况,0:匹配单词、1:新增单词、2:缺少单词、3:错读的词、4:未录入单词。 |
phoneInfos | NSArray | 音节评估详情注意:在 EvalMode 为2、3、5时,此参数为空。 |
referenceWord | NSString | 读音评估对应的单词 |
KeywordTag | NSInteger | 主题词命中标志,0表示没命中,1表示命中注意:此字段可能返回 null,表示取不到有效值。 |
SentenceInfoSet 参数说明
参数 | 类型 | 说明 |
sentenceId | Int | 句子序号 |
words | NSArray | 单词粒度详细发音评估结果 |
pronAccuracy | Float | 音素发音精准度,取值范围[-1, 100],当取-1时指完全不匹配 |
pronFluency | Float | 单词发音流利度,取值范围[0, 1] |
pronCompletion | BOOL | 发音完整度,取值范围[0, 1],当为词模式时,取值无意义 |
suggestScore | Float | 建议评分,取值范围[0,100] |
refTextId | NSInteger | 匹配候选文本的序号,在句子多分支、情景对 话、段落模式下表示匹配到的文本序号注意:此字段可能返回 null,表示取不到有效值。 |
KeyWordHits | NSArray | 主题词命中标志,0表示没命中,1表示命中注意:此字段可能返回 null,表示取不到有效值。 |
UnKeyWordHits | NSArray | 负向主题词命中标志,0表示没命中,1表示命中注意:此字段可能返回 null,表示取不到有效值。 |
TAIOralEvaluationPhoneInfo 参数说明
参数 | 类型 | 说明 |
beginTime | Int | 当前音素语音起始时间点,单位为ms |
endTime | Int | 当前音素语音终止时间点,单位为ms |
pronAccuracy | Float | 音素发音精准度,取值范围[-1, 100],当取-1时指完全不匹配 |
detectedStress | BOOL | 当前音素是否检测为重音 |
phone | NSString | 用户实际发音音素 |
stress | BOOL | 用户实际发音音素是否应为重音 |
rLetter | NSString | 音素对应的字母 |
referencePhone | NSString | 参考音素,在单词诊断模式下,代表标准音素 |
TAIError 参数说明
参数 | 类型 | 说明 |
Code | TAIErrCode | 返回错误码0:成功1:参数错误2:json 解析错误3:http 请求错误4:服务器错误详细错误信息请查看 desc 参数 |
desc | NSString | 详细错误描述 |
requestId | NSString | 请求 ID,用于订单唯一标识 |
腾讯云官网1折活动,限时活动,即将结束,速速收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠
发表评论