语音识别做完

master
伍洲行 2 years ago
parent b856ddad75
commit b536be4092

@ -26,6 +26,12 @@ android {
sourceCompatibility JavaVersion.VERSION_1_8
targetCompatibility JavaVersion.VERSION_1_8
}
sourceSets {
main {
jniLibs.srcDirs = ['libs']
}
}
}
dependencies {
@ -33,6 +39,7 @@ dependencies {
implementation 'androidx.appcompat:appcompat:1.5.1'
implementation 'com.google.android.material:material:1.6.1'
implementation 'androidx.constraintlayout:constraintlayout:2.1.4'
implementation files('libs\\Msc.jar')
testImplementation 'junit:junit:4.13.2'
androidTestImplementation 'androidx.test.ext:junit:1.1.3'
androidTestImplementation 'androidx.test.espresso:espresso-core:3.4.0'

@ -0,0 +1,10 @@
1.使用demo测试时需将res中除layout外资源拷贝到demo中assets相应的路径下;
2.使用带UI接口时请将assets下文件拷贝到项目中;
3.文档说明请参考:http://doc.xfyun.cn/msc_android/;
4.在调用sdk时,请将res/layout下xml文件拷贝至工程的layout目录下此文件为sdk内置ui所需资源缺失会导致sdk部分功能无法使用;
注: 1. 由于更新优化更新,本次(1138)的libmsc.so库需与本次Msc.jar相匹配使用之前的Msc.jar包可能会导致出错。
感谢您使用科大讯飞服务。
官方网站http://www.xfyun.cn/

@ -0,0 +1,908 @@
1.1140版本更新信息
1. SSL证书更新
1.1139版本更新信息
1. 修复部分已知bug
2. 在线听写增加小语种听写功能;
3. libmsc.so库中唤醒能力单独分出需要唤醒能力时需加入libw_ivw.so
1.1138版本更新信息
1. 优化能量VAD修复已知bug
2. 优化与服务端的网络交互;
3. 由于更新优化更新本次的libmsc.so库需与本次Msc.jar相匹配不然可能出现异常。
1.1137版本更新信息
1.新集成能量VAD效率提升近60%(亮点);
2.优化与服务端的网络交互,服务更稳定(亮点);
3.修复部分已知bug
注: 1. 由于更新优化更新本次的libmsc.so库需与本次Msc.jar相匹配使用之前的Msc.jar包可能会导致出错。
2. 由于本次SDK中集成了最新的能量VAD在线服务将支持arm、arm-v7、arm64-v8离线唤醒支持armv7和arm64,
离线命令词支持armv7。其中arm架构的libmsc.so仅支持在线能力。若在离线组合能力离线唤醒+离线命令词的SDK中
请选用armv7的libmsc.so。
--------------------------------------------------------------------
1.1136版本更新信息
1.修复部分已知安全问题;
2.修复部分已知bug
--------------------------------------------------------------------
1.1135版本更新信息
1.解决speechdemo中合成文本设置失效问题
2.优化msc.jar 业务退出内存释放逻辑;
--------------------------------------------------------------------
1.1134版本更新信息
1.解决Android9.0 部分机型对org.apache.http 不兼容问题
2.优化demo代码增加听写循环调用逻辑支持;增加合成实时音频流输出调用和说明;
MSC 5.0.41.1217
--------------------------------------------------------------------
1.1133版本更新信息
1.大数据设备信息收集更新
MSC 5.0.41.1217
1.增加离线听写能力
--------------------------------------------------------------------
1.1132版本更新信息
1.增加大数据部分日志收集模块
MSC 5.0.40.1214
1.增加唤醒闭环功能
--------------------------------------------------------------------
1.1131版本更新信息
1.增加唤醒音量回调结果返回;
2.demo中合成UI优化;
MSC 5.0.38.1199
1.增加opus编解码支持
--------------------------------------------------------------------
1.1130版本更新信息
MSC 5.0.38.1195
1.更新唤醒引擎为60引擎
2.唤醒的门限值范围修改,为{0,3000}默认值为1450
--------------------------------------------------------------------
1.1129版本更新信息
1.解决蓝牙播报漏字问题;
2.解决8.1上合成漏字问题;
3.解决speechDemo异常崩溃问题;
4.优化speechDemo中UI;
--------------------------------------------------------------------
1.1128版本更新信息
1.合成业务,暂停和重新播放回调接口无返回问题修复;
2.支持听写/识别/评测/声纹结果返回的字符编码配置;
3.支持听写业务中sdk自带ui是否显示错误码信息默认显示通过参数“view_tips_plain” 进行配置,例:
mIat.setParameter("view_tips_plain","false");此处即为设置错误码不显示。
MSC 5.0.37.1181
--------------------------------------------------------------------
1.1127版本更新信息
1.语义模块统一采用aiui语义后续不再继续提供msc语义;
2.speechdemo关于声纹示例体验优化;
3.解决Android8.1上合成文本音频出现乱码问题;
MSC 5.0.36.1178
--------------------------------------------------------------------
1.1126版本更新信息
1.合成语音播放resumeSpeaking 接口增加audio 焦点获取;
2.synthesizeToUri 接口部分参数设置失败问题修复;
3.听写/合成 增加ico编码支持,"aue","ico";
4.修复MODE_WORLD_READABLE调用导致安全检测爆出的安全隐患
MSC 5.0.36.1178 更新信息
1.增加ico编解码支持
2.离线包增加aiui支持
-------------------------------------------------------------------
1.1125版本更新信息
1.听写小窗口提供讯飞输入法下载链接,注意 替换iflytek下的xml资源
2.在线人脸声纹可直接调用身份验证接口speechdemo中包含在线人脸和声纹
3.评测demo中添加直接写入音频方式详见demo中注释说明
MSC 5.0.36.1176更新信息
1.解决Android 8.0上崩溃问题
--------------------------------------------------------------------
1.1121版本更新信息
1.去除语记支持
2.更新底层库版本到5.0.35.1168
MSC 5.0.35.1168更新信息
1.Android 版本编译时增加 -fpic,修复Android 7.0以后Android 版本上出现的so加载崩溃问题
2.完善合成发音人列表
--------------------------------------------------------------------
1.1120版本更新信息
1事件回调修正会话 SID 值正常,但返回为空的问题;
2AIMIC 修正在唤醒会话结束偶现崩溃的问题;
3权限修正没有 android.permission.ACCESS_NETWORK_STATE 时无法使用的问题;
4录音加入录音时使用蓝牙的选项SpeechConstant.BLUETOOTH;
5合成修改合成进度中 spellinfo 的返回以JSON格式并增加音频长度信息需设置 "audio_info" 参数为真);
6识别增加在会话开始时通过参数设置获取设备信息SpeechConstant.DVC_INFO 参数需设置为真);
已知问题:
1AIMIC唤醒一定次数时报 27019 问题,为唤醒引擎返回结果 EOS 值错误引起;
2合成部份手机设备上在蓝牙播放回调 onComplete 时,若马上开始录音,合成播放末尾漏字(安卓系统蓝牙播放延迟原因,暂不解决);
--------------------------------------------------------------------
1.1119版本更新信息
1翻译增加翻译示例和文档说明
2合成1) 增加淡入淡出参数 TTS_FADING默认不启用2) 加长音频结束播放时加播的空白音频,优化蓝牙合成播放末尾漏字问题;
3AIMIC 修正偶现写音频失败问题;(自测通过)
已知问题:
1AIMIC唤醒一定次数时报 27019 问题为唤醒引擎返回结果EOS值错误引起
2合成厂商反馈蓝牙播放回调 onComplete 时,若马上开始录音,合成播放末尾漏字;
--------------------------------------------------------------------
1.1118版本更新信息
1语义理解增加 SCENE 语义情景参数;
2AIMIC修正 27018 问题;
3DEMOa) 语义理解DEMO去掉不支持的语义说法提示修正网址链接b) 加入语义情景设置代码示例;
已知问题:
1AIMIC唤醒一定次数时报 27019 问题为唤醒引擎返回结果EOS值错误引起
---------------------------------------------------------------------
1.1116版本更新信息
1语义理解默认语义使用 3.0 版本;
2文档新手指南文档不能功能用同一个PDF文档修改默认语义版本说明
已知问题:
1AIMIC唤醒一定次数时报 27019 问题为唤醒引擎返回结果EOS值错误引起
---------------------------------------------------------------------
1.1116版本更新信息
1语义理解默认语义使用 3.0 版本;
2文档新手指南文档不能功能用同一个PDF文档修改默认语义版本说明
3DEMOa) 语义理解DEMO去掉不支持的语义说法提示修正网址链接b) 加入语义情景设置代码示例;
已知问题:
1AIMIC唤醒一定次数时报 27019 问题为唤醒引擎返回结果EOS值错误引起
---------------------------------------------------------------------
1.1116版本更新信息
1语义理解默认语义使用 3.0 版本;
2文档新手指南文档不能功能用同一个PDF文档修改默认语义版本说明
3AIMIC a) 增加获取几麦和AIMIC版本的参数( aimic_on_channel, aimic_on_version ),增加设置 REAL BEAM 参数 ( aimic_on_real_beam )
b) 修改清空缓存的处理,增加三个线程同步;减少缓存空间大小,减少由于缓存多时,唤醒结果返回与 CAE frame count 相差较大,使 CAE 不回调结果,而报 27019 的情况;
4DEMO SpeechDemo, MscV5PlusDemo 修改语义报错时的提示,增加新版本重新配置语义的说明;
MSC 5.2.0.1044 更新信息AIMIC SDK
1将AIUI1042版本合并到AIMIC分支版本
已知问题:
1在构建版本时3.0语义在正式域名上还不可用,仅能在测试域名上可用: server_url=http://60.166.12.151/onlytest.htm
2在构建版本时新手指南说明的语义结果说明文档的超链接http://aiui.xfyun.cn/info/protocol里面还没放置文档
3AIMIC唤醒一定次数时报 27019 问题为唤醒引擎返回结果EOS值错误引起
---------------------------------------------------------------------
1.1115版本更新信息
1资源目录删除不要的 IVW 40 的资源;删除 1.0 版本的 ASR 资源,并把原 asr_two 文件夹改名 asrIVW 50 资源区分中英目录;
2因 5.2.0.1040 没有更新最新的 模型VAD 代码,故 AIMIC 用的库为在 5.2.0.1040 基础上同步了最新模型VAD代码后的库
MSC 5.0.32.1156 更新信息(普通 SDK
1、升级唤醒引擎集成5.0.1016版本取代之前的4.0BN引擎:
1支持中文唤醒英文唤醒中文英文唤醒资源不同
2支持windowslinuxAndroid平台
35.0引擎不兼容4.0,3.6引擎资源;
4资源头部格式变化
2、针对唤醒资源头部授权信息的校验添加可以不校验的逻辑如果资源中有授权信息则进行校验如果没有但是提供的msc库编译时添加了宏IFLY_SPEECH_PLUS_SUPPORT则不进行校验否则仍校验。
MSC 5.2.0.1040 更新信息AIMIC SDK
1、唤醒资源合并成一个文件资源头格式变化
2、唤醒多路由单独的宏控制
解决彭锐反馈的开了多路唤醒之后aiui业务cpu占用高的问题经过排查是因为开启多路唤醒打开了宏PARALLEL_LINES_SUPPORT影响了aiui业务多路唤醒控制增加一个新的宏IVW_PARALLEL_LINES_SUPPORT
3、针对唤醒资源头部授权信息的校验添加可以不校验的逻辑如果资源中有授权信息则进行校验如果没有但是提供的msc库编译时添加了宏IFLY_SPEECH_PLUS_SUPPORT则不进行校验否则仍校验。
---------------------------------------------------------------------
1.1114版本更新信息
1识别 a) 增加默认方言设置为 mandarin
2合成 a) 修改淡出字节没有根据采样率调整,而使不同采样率下长短不一的问题;
b) 修正MSC和语记之间切换时可能当前合成播放未停止的问题;
c) 在 ENGINE_TYPE 为 TYPE_DISTRIBUTED 时,默认进行网络检查;
3唤醒 a) 唤醒在音频缓存超过两秒时,清空当前消息中的音频数据, 避免OOM问题;
4录音 a) 修改录音检查时长判断方式,仅在返回字节小于缓存时; sleep避免可能不及时获取音频而缓存满丢失的问题
5AIMIC a) 增加线程优先级设置;
b) 修正在CPU占用较高时由于 frame_count 错误而引起角度不对的问题;
6音频检测 a) 模型VAD增加句子重设参数 RESET_SENTENCE
b) 模型VAD更新引擎和资源修正端点状态返回延迟可能超过 250 ms 的问题;
7日志a) 增加告警级别日志(目前仅在唤醒缓存不足时用到);
8文档a) HTML文档链接大部份在新窗口打开
b) 修改默认ENGINE_MODE 值说明;
c) 增加分布式模式参数值 TYPE_DISTRIBUTED ;
d) 音频检测,增加短音频过滤说明;修改前端点, 后端点值域;修改 start 结果值、状态值说明;每次写入音频长度说明;暂不使用 start 和 end 值说明;
9音频文件保存 a) 修正没有关闭文件句柄的问题;
10, Demo: a) 修正在线人脸 Demo 没有检查会话开始的错误,而一直等待的问题;
b) 音频检测 Demo 修改结果显示;
11错误码 AIMIC 错误码从26XXX改成27XXX
已知问题:
1音频检测 a) 当每次写入的字节比较大如500ms以上时获取的 seg 值不正确;
---------------------------------------------------------------------
1.1113版本更新信息
1唤醒 增加通过事件返回录音音频流参考《MSC Reference Manual.html》关于 WakeuperListener 接口 onEvent 函数说明;
2合成在暂停恢复停止时增加淡入淡出的效果优化播放体验
3demo 修正人脸DEMO由于服务返回结果为错误码而导致崩溃的问题修正在没有放置 libmsc.so 时DEMO因空指针引用而崩溃的问题
4初始化 去掉 Utility setParameter getParameter 时的单例判断,修正因此而导致获取参数和设置参数不生效的问题;
已知问题:
1在合成离线使用语记模式在线SDK默认离线功能使用语记从在线MSC模式合成未播放完马上使用离线语记模式合成时上一次在线合成播放没有被取消而是在当前合成语记模式播放完后继续播放
MSC 5.0.30.1153 更新信息:
1、将1152版本ssl内容同步回主版本nameserver以及结构化日志scs支持ssl加密
2、离线授权auth支持ssl加密业务短连接不计划支持即使设置了ssl如果走短连接也不生效
3、去除日志中认证信息的打印
4、支持SHA204A硬件授权方案
5、解决唤醒可能出现的16005问题论坛开发者反馈
6、代码优化发往服务端参数部分去除冗余逻辑
7、结构化日志里会添加进 几个字段记录的是socket建立后的一些统计信息用来辅助判断网络问题只在Linux和Android平台下收集
8、增加情感发言人设置 ssb 中传入emot
9、修复离线合成自动读取发言人在android平台报错问题
---------------------------------------------------------------------
1.1112版本更新信息
1所有业务功能 创建单例时,若 SpeechUtility.getUtility 为空,返回 null
2注销 SpeechUtility destroy 时先判断当前是否有会话进行修正因会话进行中注销而使SDK不可用的问题
3DEMO 听写 DEMO 提示中,去掉河南话;
4文档 a) VAD 检测功能加入未支持说明; b) 去掉 ISE_ENT以 LANGUAGE 代替;
5IVW 增加保存最近1分钟的音频IVW_AUDIO_PATH
6编译 修改混淆配置在Msc.pro 中,去掉唤醒相关的保留(减小在线 Msc.jar 大小在MscV5luse.pro中包含 Msc.pro 所有配置;
MSC 5.0.29.1151 更新信息:
1、合并张涛1049版本以及revision7804-7820功能点到主版本:
1)增加JNI日志级别函数; 林国雄
2)修改JNI日志打印把频繁打印的日志用INFO重要日志用LOGCAT; 林国雄
3)结构化日志上传支持代理设置 MSPLogin中设置 proxy_host/proxy_ip, proxy_port; 张涛
4) ist ise 在线tts 的ssb请求中 增加 fac参数用于强制 appid校验; 张涛
5)优化unique_id记录改为首次解析lgi_params时记录unique_id后续无需每次都解析lgi_params; 王逸群
6)评测在线合成延迟登录ssb中带入auth_id 张涛
7)更新模型VAD引擎增加置信度函数增加 vad_reduce_flow 参数 张涛,林国雄
2、车载反馈偶尔获取不到结果问题修复
---------------------------------------------------------------------
1.1111版本更新信息
1asr: a) 删除没有使用到的 MscRecognizerAIMic.java 及其引用;
b) 修改前端点消除时的音频处理从独立的线程转回 MscHandler 线程中,并修改可能重复返回同一音频的问题;
2文档开放语义文档更新至语义官网上最新的版本
MSC 5.0.28.1150 更新信息:
1. 回退到1148的代码版本
2. 基于1148代码上解决sessinfo没有传入正确的sid的问题
---------------------------------------------------------------------
1.1110版本更新信息
1ivwa) 修正 SDK 设置的 IVW_NETVAL 覆盖外面设置值的问题;
2aimic a) 修正 aimic BUF_MODE没有设置到JNI的问题
b) 增加无效结果错误码;
c) 减少原始音频的缓存大小;
d) 应用层不直接使用 aimic 的函数, 识别音频通过唤醒事件返回;
e) aimic.jar 合并到 msc.jar中作为唤醒的一部分
f) 增加当前缓存中留存数据大小的日志;
g) 修正在非持续唤醒时因录音机重复开启时状态值没有设置为0而返回 26008 的问题;
h) 修正在 buf_mode=2 时,还会因原始音频缓存不够而返回 26014 错误的问题;
i) 修改调用 alsa 录音的方式从直接引用改为反射调用编译时默认不带 alsa 的类
3日志 a) 调整日志级别,默认为 normal只打印关键的会话日志AUW等频繁打印的日志只在 detail 或 all 级别时打印;
4文档 a) 去掉 HTML 文档中 河南话;
b) 去掉 HTML 文档中 DOMAIN 的默认值说明;
c) PDF 文档中去掉Q群网址改为论坛
5模型VAD a) 增加置信度结果 confidence 和对应的 Native 函数(因 5.2.0.1032 libmsc.so 不带该 Native 函数,此版本 confidence 值全部为0
b) 修改音量值范围修正因引擎变化音量值最大只到7的问题
6asr a) 修改获取默BOS, EOS的方式;
b) 在消除前端点静音时,禁用 libmsc.so 中的VAD直接使用模型VAD检测整个过程;
aimic jni 更新信息:
1增加禁止写入IVW音频的参数 ivw_auw_disable用于测试默认为 FALSE
2char 转 int 时,进行安全判断;
3增加无效结果判断返回 26019
4增加 ivw_sum_disable 参数,判断是否要启用 EOS 累计,适应 IVW 引擎的EOS值返回方式默认为 FALSE
5增加 ivw_sum_by_engine 参数,判断是否已在引擎中累计 EOS 值 ,默认为 TRUE
6增加 唤醒结果全部转为 KEY=VALUE 方式,传给 CAE且 frame_count 一直累计,传给 CAE 时不对1000求余
7 libaimic.so 与 libaimicjni.so 合并为 libaimic.so
8增加线程等待把原来的每一毫秒的SLEEP改成直接等有数据再处理减少空闲时线程对 CPU 的占用;
9增加销毁线程前判断上次的唤醒消息是否有回调完避免因引用音频BUF而崩溃的问题
10 增加 ivw_auw_sync 参数,判断是否要把三个唤醒线程同步,默认为 TRUE
11 增加 AIMIC 未处理唤醒消息时的,返回错误 26018
msc 5.2.0.1032 更新信息:
1、升级唤醒引擎集成5.0.1016版本新增支持英文唤醒资源分为common资源和唤醒词资源common资源不加头英文和中文不同的common资源目前只支持windows和Android不支持linux
2、唤醒闭环优化上传逻辑优化车载需求实现通过参数控制每天上传上传成功的数据条数
3、唤醒闭环优化功能可裁剪IVWNET_NOT_SUPPORT=1
4、QIVWGetResInfo内存泄漏修复
5、离线授权在连接超时情况下报错16005问题修复
---------------------------------------------------------------------
1.1109版本更新信息
1使用 5.0.27.1146 构建 online, mfv, ifd 1109 版本;
---------------------------------------------------------------------
1.1108版本更新信息
1合成增加设置保存预合成音频文件名的参数
MSC更新信息
5.0.27.1146 (不带 VAD 接口)
1、在所有在线业务的ssb请求参数段中添加unique_id字段。
2、"语音云服务端通过nameserver下发ip并新增标识字段""compel""表示是否强制使用80端口。若没有强制使用80端口则由msc自行选择合适的port建立连接1028传输数据。
3、新增当网络类型切换重新进行dns请求。
4、现网ns版本协议号由1.2升级为1.3。
---------------------------------------------------------------------
1.1107 版本更新信息
1录音当录音时返回负值状态时直接抛出异常
2JNI添加AIUI相关的接口仅 Native 定义);
3有数数据采集a) 包由 com.iflytek.thirdparty 移动到 com.iflytek.cloud.thirdparty; b) 捕获异常的 Exception 改为 Throwable
4AIMICa) 主版本与 AIMIC 分支合并; b) aimic 增加 ALSA JNI 日志控制;
5使用 5.0.26.1144 版本库;
MSC更新信息
5.0.26.1144
"基于1133版本维护AIMIC分支版本
1、AIMIC多路唤醒优化修改多路版唤醒会话对象维护方式同识别合成业务去除业务全局锁消除锁带来的性能消耗多路版情况下QISRSessionBegin耗时优化尤为明显。5.0.27.1134加入)
2、唤醒闭环优化唤醒闭环优化5.0.27.1139加入)
1、上传逻辑优化
2、通过参数控制每天上传上传成功的数据条数
3、修改后的详细逻辑参见文档《唤醒闭环客户端唤醒词音频收集及上传.docx》以及《上传数据详细设计.vsd》
3、唤醒闭环优化功能支持裁剪通过宏IVWNET_NOT_SUPPORT裁剪默认包含闭环优化目前裁剪只支持windowslinuxandroid
windows在msc_lua工程添加此宏5.0.27.1134加入)
4、修复QIVWGetResInfo接口的内存泄漏
通过MSPStrSplit函数解析后的数据内存未释放5.0.27.1134加入)
5、离线授权在连接超时情况下报错16005问题修复5.0.27.1135加入)
6、解决在线业务慢问题dns解析问题详细见5.0.27.1139版本修复说明。5.0.27.1139加入)"
7、升级BN唤醒引擎运算量优化版本4.0.1017
---------------------------------------------------------------------
1.1106 版本更新信息
1配置项 a) Setting 中增加设置当前地区的函数 setLocale b) 优化日志类的实现和设置方式,把 Setting 从日志类的分离出来;
2闭环唤醒 a) 修正查询资源时,在更新资源后,没有使用新资源信息来查询的问题;
3合成 a) 优化在获取MSC的合成信息有可能为负数时重置为0 b) 增加返回进度的精度控制参数 tts_proc_scale 默认值与原来不变100
4人脸 a) 会话时增加设置URL参数
5VAD增加VAD检测DEMO开放VAD功能
MSC更新信息
5.0.27.1141
1、将唤醒业务回退到1135版本唤醒引擎回退到4.0.1007唤醒闭环部分除了修复若干问题其他未做修改与1139一致
2、修复唤醒闭环上传模块若干bug
3开启闭环唤醒参数ivwnet_mode=1上传失败情况下保存到本地数据>2M时未丢弃数据
4断开网络执行用例ivw_upload.log日志中显示数据上传失败未将上传失败的数据保存至本地生成ivwnet.txt文件直接丢弃数据
5.0.27.1143
1、解决中文繁体以及英文windows操作系统下离线识别问题
2、QIVWGetResInfo接口只对Android控件开放若需要测试需要修改msc_lua.defwindows和msc.maplinux
3、更新MetaVad代码
4、解决断网时稳定性测试ISR会句柄数一直增加的问题
5、重构sessinfo"
6、解决听写指定aud=raw时多过一次VAD的问题VAD在 isr.lua中先配置并滤过一次
---------------------------------------------------------------------
1.1105 版本更新信息
1修正调用 destroy 时,崩溃的问题;
2闭环唤醒修正查询哪个资源更新时原始资源目录不对的问题在没有配置项时默认进行资源查询
MSC 5.0.26.1140 修改:
基于1133版本维护车载唤醒分支版本
1、升级唤醒引擎集成5.0.1016版本新增支持英文唤醒资源分为common资源和唤醒词资源common资源不加头英文和中文不同的common资源目前只支持windows和Android不支持linux
2、唤醒闭环优化上传逻辑优化车载需求实现通过参数控制每天上传上传成功的数据条数
3、唤醒闭环优化功能可裁剪IVWNET_NOT_SUPPORT=1
4、QIVWGetResInfo内存泄漏修复
5、离线授权在连接超时情况下报错16005问题修复
6、车载反馈在线语义听写慢问题解决
---------------------------------------------------------------------
1.1104 for aimic 版本更新信息:
1更新AIMIC库不修改 NEW 传进来的 UserData,保证那参数是 NULL时也能正常运行在角度回调里通过 param1 把 beam 回调给外面;
2修改 AIMIC JNI每路唤醒使用单独线程进行音频和消息回调使用单独线程进行唤醒音频直接在 JNI 处理,减少音频队列和唤醒结果回调的耗时;修正内存泄漏等;
3更新 MSC 5.0.16.1133,减少唤醒写音频耗时,修正由于阻塞而使缓存用完报错的问题;
4优化缓存的内存占用
5增加 AIMic Reference Manual.html AlsaRecorder Reference Manual.html 文档;
6增加 AIMicDemo
7src 目录新增 AimicTest 测试工具以及AIMIC模块的源码AIMicLibsrcAIMIC_JNI
---------------------------------------------------------------------
1.1103 版本更新信息
1、语义理解语义理解 ASR_UNDERSTAND 参数名,改为 ASR_SCH
2、合成回调合成到文件的打断错误时增加是否在主线程判断在主线程时可避免 在 onComplete 中开启新会话时,死循环而崩溃的问题;非主线程回调时,依然会出现此问题(目前需要应用来避免这种调用);
3、合成增加 tts_min_audio_len 参数可设置合成最短的缓存时长修改默认最短缓存音频时长由原来20秒左右改为60秒以兼容在线合成在指定的符号下返回音频长度与文本长度没有关系的合成情景
4、唤醒优化闭环查询和使用服务器资源修改默认查询间隔为 24 小时;并在当前本地已下载网络资源,且 net_mode 为模式 2 时,网络资源比本地资源新时, 直接使用下载的资源,而不必每次要查询更新才能使用;
5、唤醒在文档和DEMO中去掉 net_mode 参数值中的 模式 2 说明,此模式只在高级用户中告知其使用;
6、编译保留 VolumeUtil FileDownloadListener 两个类;
7、logcat 日志:有数采集 和 MMLC 在获取 MSC 参数失败时的 ERROR 日志,改成 DEBUG 日志不影响SDK使用避免误导开发者
8、JavaDoc语法识别增加网页生成语法的使用说明修改 JavaDoc 概览页作者字样,通过 JS 控制可替换成 灵犀云;
9、有数采集灵犀云修改有数采集逻辑以兼容灵犀SDK分支的数据采集讯飞云版本SDK中不进行有数采集
MSC 5.0.27.1139 修改:
升级唤醒引擎:
1、集成5.0.1016版本;
2、新增支持英文唤醒
3、资源分为common资源和唤醒词资源common资源不加头英文和中文不同的common资源
4、路径参数设置需要传入common资源和唤醒词资源路径且common资源必须放在前面例如ivw_res_path =fo|res/ivw/IvwCommonRes.irf|0|0;fo|res/ivw/ivModel.xiaoainihao.irf.head|0|0
已知问题:
1在调用 SpeechRecognizer, SpeechSynthesizer, VoiceWakeuper 的 destory 销毁引擎时,底层库 MSC 概率性崩溃;
---------------------------------------------------------------------
1.1102 版本更新信息
1、语记链接参数添加设备信息
---------------------------------------------------------------------
1.1101 版本更新信息
1、语音合成修复合成空文本导致的异常问题
2、SDK优化离线功能授权机制
3、SDK优化在会话线程启动时增加异常抛出
4、SDK优化编译指令兼容AS最新版本编译
5、录音机模块修复部分机型上无权限时获取数据不报错问题
6、优化获取版本失败日志改为私有日志
7、有界面识别对象音量回调增加非空判断
---------------------------------------------------------------------
1.1100 版本更新信息
1、语音识别新增模型VAD
2、修复文本语义频繁调用卡死问题
3、修改获取网络类型的参数的逻辑
关于平台1129唤醒支持注意事项
1、1129版本能够加载3.6老资源但不支持3.5老资源;
2、3.6老资源支持闭环优化必须每个词都要设置唤醒门限值否者未设置门限唤醒词唤醒会出问题返回错误码16005
---------------------------------------------------------------------
1.1099 版本更新信息
1、修复SpeechUtility创建异常问题
2、身份验证鉴别功能新增海量鉴别功能
3、优化文档及部分开放类注释说明
---------------------------------------------------------------------
1.1098 版本更新信息
1、MSC修复与第三方jar混淆冲突问题
2、数据收集增加在createUtility进行收集
3、数据收集修复应用列表上传时间设置无效
4、数据收集修复开启统计无法关闭问题
5、数据收集取消GET_TASKS权限判断
6、语音合成修正频繁调用合成播放导致OOM问题
---------------------------------------------------------------------
1.1097 版本更新信息
1、身份验证鉴别功能新增查询用户、退出组、删除组接口
2、移除日志收集权限检查
3、语音合成修改语速倍速方法兼容5.5引擎;
4、修改20002超时错误提示
5、优化消息优先级去除min等级
---------------------------------------------------------------------
1.1096 版本更新信息
1、离线合成引擎升级为aisound 6.0 pro
2、离线识别引擎升级为aitalk two
3、修复特殊设备调用系统API崩溃问题
4、修复getVersion返回不正确问题
5、优化唯一ID中mac地址为动态获取
---------------------------------------------------------------------
1.1093~1.1095 版本更新信息
1、新增应用列表及活跃应用收集功能
2、新增鉴别错误码及错误码描述
---------------------------------------------------------------------
1.1092 版本更新信息
1、唤醒业务增加了推荐门限
2、唤醒业务优化查询和下载内存问题
3、评测业务修改startEvaluating返回值为int类型
4、评测业务修改取消方法为cancel()
5、声纹、评测、身份验证接口调用添加非空判断
---------------------------------------------------------------------
1.1091 版本更新信息
1、增加鉴别功能
2、优化唤醒业务添加强制请求策略不与缓存文件进行比较
3、优化唤醒业务查询和下载接口添加同步锁
4、优化唤醒业务startListening接口增加返回错误码
5、修复评测和声纹业务内部读取文件数据无法中断问题
---------------------------------------------------------------------
1.1089 版本更新信息
1、优化离线人脸返回结果格式
2、支持每个业务setParameter设置engineMode
3、优化文档及部分开放类注释说明
4、修改获取版本号的方法
---------------------------------------------------------------------
1.1088 版本更新信息
1、开放唤醒持续优化功能支持资源持续优化提升唤醒效果
2、修改唤醒业务开启默认不获取音频焦点
3、优化离线人脸视频流接口支持关键点信息参数控制
4、优化命令词识别中是否传入语法判断条件
5、有数数据收集、编解码及VAD模块同步至主版本
---------------------------------------------------------------------
1.1087 版本更新信息
1、集成UniqueID模块增加Manifest权限
2、在线合成增加情感发音人小艾SpeechConstant新增EMOT情感参数
3、在线合成改为只走MSC以解决语记在部分手机后台被限制网络权限的问题
小米MIUI设置->其他高级选项->电量和性能->神隐模式)
---------------------------------------------------------------------
1.1086 版本更新信息
1、使用最新离线人脸so文件支持64位
2、优化部分低端机器上视频流检测不可用问题
3、优化图片检测及视频流检测的返回结果
4、修复图片检测判断条件防止出现空指针
5、优化身份验证参数传递降低CPU使用率
6、SpeechModuleAidl增加异常处理防止启动崩溃
7、优化异常日志输出e.printStackTrace() 改为logE控制输出
8、业务调度Handler增加捕获NATIVE引用的错误
---------------------------------------------------------------------
1.1085 版本更新
1、使用msc版本1101版本测试so增加闭环上传音频
2、添加获取msc引擎版本方法暂不开放
3、开放对外文件下载类回调监听FileDownloadListener
4、唤醒业务改为从SessionBegin启动引擎
5、唤醒业务增加闭环优化网络模式ivw_net_mode参数
6、唤醒业务增加请求闭环模型功能
7、唤醒业务增加下载唤醒模型功能
---------------------------------------------------------------------
1.1084 版本更新
1、修改错误码拼写错误
2、在ResourceUtil添加唤醒资源路径
3、增加身份验证传递网络类型
4、增加获取引擎版本号接口。通过SpeechUtility.getParameter实现
5、增加参数view_tips_plain控制是否在UI中显示错误码
6、解决ASR_NOMATCH_ERROR不生效的问题
7、增加1.login传递基站信息
8、增加本地授权错误码
9、修正注释
---------------------------------------------------------------------
1.1083 版本更新
1.使用msc版本1109版本so增加证书功能
2.修正SpeakerVerifier类注释中有误的地方
3.修正SpeakerVerifier类cancel函数带boolean参数的问题
---------------------------------------------------------------------
1.1082 版本更新
1、唤醒支持Ivw4.0引擎使用msc版本1101
2、接口方法注释信息详细请见代码注释或者javaDoc
3、修改音频数据音量计算方法
---------------------------------------------------------------------
1.1081_release 版本更新
1、关闭动态修正ASR_DWA参数修改Demo及相应说明修改
2、完善v5版本对外接口方法注释信息详细请见代码注释或者javaDoc
---------------------------------------------------------------------
1.1081 版本更新
1、上传字段添加基站信息mmlc
2、完善对外接口方法注释信息
3、修改synthesizerToUri合成无音频时空格、英文发音人合成中文等情况抛出10118错误
---------------------------------------------------------------------
1.1080 版本更新
1、使用1101版本离线功能so库
2、去除v5和v5+判断条件
3、详细部分类的注释说明
---------------------------------------------------------------------
1.1079 版本更新信息
1.接口&参数调整:
1、 新增SpeechUtility增加同步锁
2、 新增prot_ver=50的默认参数设置
3、 新增通过onEvent接口抛出音频数据
4、 新增通过onEvent接口抛出session id
5、 修改onVolumeChange接口回调增加buffer
6、 修改声纹key值ISV_AUDIOPATH为ISV_AUDIO_PATH
7、 修改缓存音频逻辑详见TTS_BUFFER_TIME参数说明
8、 修改人脸、声纹用户id Key值使用新Key值AUTH_ID参数
2.功能优化:
1、 修改性能日志模块
2、 新增load库的错误日志
3、 修改关于防止int数据溢出的代码
4、 修复userwords类无法插入空内容的缺陷
5、 修改constant.TEXT字段移到内部msckeys中
3.语记相关:
1、 修改语音+下载地址为语记新地址
2、 修改语音+action为语记的新action
---------------------------------------------------------------------
1.1077 版本更新信息
1.联系人增加destroy接口
2.支持保存音频wav格式
3.将是否通知异常打断的参数名称由ASR_INTERRUPT_ERROR改为MFV_INTERRUPT_ERROR
4.修改部分注释及去除VerifierUtil中旋转方法,移动FaceRect类和绘图方法至demo
5.去掉对IdentityVerifier中MSC是否已经加载的判断
6.人脸和融合验证错误码和描述
7.混淆文件打开身份验证和工具类
---------------------------------------------------------------------
1.1076 版本更新信息
---------------------------------------------------------------------
1.1075 版本更新信息
1.离线人脸测试稳定版本;
2.离线人脸检测支持图片和视频流;
---------------------------------------------------------------------
1.1074 版本更新信息
1.离线人脸检测能力融合至msc
2.离线人脸检测支持图片和视频流;
3.移除离线人脸关键点检测能力;
---------------------------------------------------------------------
1.1073 版本更新信息
1.合成Aisound合成音频无尾部静音导致读最后一个字很短min基础上增加4KB的静音块。
2.注释完善,官网链接修改。
3.人脸删除离线人脸JNI类保留外部接口类混淆离线人脸接口。
4.语音+避免客户端在使用语音功能的同时语音服务被异常打断造成mService为null的空指针错误
5.优化:
1、将listener置空解决无法释放context的问题2、修改onBeginOfSpeech回调判断快速stop
2、修复int值计算溢出导致播放进度为负值问题
3、增加SSB传递 msc.skin字段
6.性能测试唤醒、声纹、转写、识别、评测添加SessionBeginEnd字段
7.lib_name 对外开放,建议预装软件修改名称
---------------------------------------------------------------------
1.1072 版本更新信息
1.在线听写增加结果动态修正功能;
2.修复SpeechUtility在子线程中创建崩溃的bug
3.cancel前进行判断避免打印errorlog;
4.新增检查语音+时错误码:20020,表示系统预装版本语音+;
5.优化参数注释;
6.删除获取通话记录的接口和观察者;
---------------------------------------------------------------------
1.1071 版本更新信息
1.修正由于读音频比当前播放块多引起CED比音频快的问题
2.修改打包工具根据v5+/语音+来设置engine_mode
3.增加唤醒注册功能(未完成);
4.评测新增两个字段在Demo中解析
---------------------------------------------------------------------
1.1070 版本更新信息
1.使用1089版本so库;
2.新手指南文档修改;
3.语音评测demo修改;
4.修复本地合成多客户端切换调用导致的应用崩溃问题;
5.修改msc_1088版本ced获取方式;
6.评测增加20秒网络超时超时报20002;
---------------------------------------------------------------------
1.1068 版本更新信息
1.使用1086版本so库;
2.增加语音评测接口;
3.增加人脸识别接口;
4.更换1086版ced获取接口;
5.合成UNICODE去除两个字节头部解决ced不准问题;
6.删除地图区域参数area_key;
---------------------------------------------------------------------
1.1067 v5+版本更新信息
1.使用1042版本so库;
2.增加体验包功能;
---------------------------------------------------------------------
1.1063 v5+版本更新信息
1.本地合成语速扩充到0-200
2.初始化时对调用进程名称进行判断,解决由第三方库造成的子进程重复调用问题;
3.修复部分情况下无onEndOfSpeech回调的bug
4.修复在个别手机上获取联系人出错的Bug;
---------------------------------------------------------------------
1.1058 v5+版本更新信息
1.增加本地合成功能;
---------------------------------------------------------------------
1.1057 v5+版本更新信息
1.增加本地命令词功能;
2.增加唤醒+本地命令词识别功能;
---------------------------------------------------------------------
1.1048 v5+版本更新信息
1.使用v5+实现本地能力;
2.优化响应速度,节省用户流量;
---------------------------------------------------------------------
1.1039版本更新信息
1.调整代码,优化接口调用耗时;
2.修复异常调用情况的错误码;
3.更新文档和demo
---------------------------------------------------------------------
1.1038版本更新信息
1.修复检测语音+安装bug
2.文档更新;
---------------------------------------------------------------------
1.1037版本更新信息
1.调整整体识别框架,提升识别效率;
2.提供云+端识别能力;
3.增加错误码提示文字;
4.文档更新;
5.demo重新编写完善;
---------------------------------------------------------------------
1.1032版本更新信息
1.精简so库尺寸
2.增加错误码;
3.修复上次识别立马开始下次识别可能报10132错误的问题
---------------------------------------------------------------------
1.1031版本更新信息
1.修复TextUnderstander非主线程回调的问题
2.增加合成语调参数;
3.默认发音人设置;
4.优化底层协议交互,提升响应时间;
---------------------------------------------------------------------
1.1030版本更新信息
1.修复合成打断失败问题;
2.优化识别和合成效果;
---------------------------------------------------------------------
1.1029版本更新信息
1.增加错误码中文注释;
2.修复部分public字段被混淆的问题
3.增加开放语义2.0协议文档和Demo
---------------------------------------------------------------------
1.1028版本更新信息
1.进一步精简Jar尺寸至179K
2.支持通过参数设置开放语义2.0协议;
3.修复内测版本功能及接口测试过程中发现的问题;
4.完善API手册和新手指南
---------------------------------------------------------------------
1.1027版本更新信息
1.整合语音控件、讯飞语音+、跨平台语音+的错误码文件ErrorCode更新错误提示
2.精简语音控件尺寸由400K减至200K
3.开放无UI的识别、合成接口增加语音转语义SpeechUnderstander和文本转语义TextUnderstander接口
4.传参接口修改为setParameter公用参数通过SpeechConstant类读取相关说明更新在JavaDoc中
5.修改UI界面使用新版简洁风格摒弃“按钮”点击操作通过“点触屏幕”完成相同功能
6.修改识别、合成的引擎参数使用language、domain等
7.支持实时改变合成音频播放的StreamType声音类型
8.支持实时改变语音识别的AudioSource声源
9.提供外部写录音文件接口,同时支持保存识别、合成的音频;
10.修改回调接口删除onEnd等接口在JavaDoc和新手指南中增加相关说明
11.优化底层协议代码,提供识别响应速度;
12.识别和语义返回原始结果通过外部应用层进行解析示例代码更新至MscDemo
---------------------------------------------------------------------
1.1026版本更新信息
1.修复合成缓冲状态下不可以暂停的问题;
2.对Android4.4机型进行适配,优化相关代码兼容性;
---------------------------------------------------------------------
1.1026版本更新信息
1.初始化接口修改为SpeechUser#Login转写、合成服务之前均需要调用
2.优化客户端响应速度;
3.更新Demo和开发文档中初始化部分说明
---------------------------------------------------------------------
1.1025.Lua版本更新信息
1.初始化接口修改为SpeechUser#Login转写、合成服务之前均需要调用
2.优化客户端响应速度;
3.更新Demo和开发文档中初始化部分说明
---------------------------------------------------------------------
1.1025版本更新信息
1.优化识别接口封装,增加连接成功率;
2.SpeechListener类名修改为TextUnderstander
---------------------------------------------------------------------
1.1024版本更新信息
1.优化个性化转写的成功率;
---------------------------------------------------------------------
1.1023版本更新信息
1.优化识别响应时间;
2.更新开发文档,修正部分错误描述;
---------------------------------------------------------------------
1.1022版本更新信息
1.优化客户端调度,提升识别的响应速度;
2.增加系统未安装浏览器情况下,点击"详细"的跳转提示;
---------------------------------------------------------------------
1.1021版本更新信息
1.优化数据上传接口,提升上传的成功率;
---------------------------------------------------------------------
1.1020版本更新信息
1.对网络进行优化解决报20019网络繁忙的问题
---------------------------------------------------------------------
1.1019版本更新信息
1.支持设置识别界面取消按钮的左右位置;
2.支持参数控制音频播放方式和音频焦点的获取;
---------------------------------------------------------------------
1.1018版本更新信息
1、增加联系人ContactManager和用户词表UserWords的个性化接口;
2、增加个性化接口的说明文档并在Demo中添加相关示例代码
3、适配Android2.2版本以上的AudioFocus机制
---------------------------------------------------------------------
1.1017版本更新信息
1、优化网络连接解决长时间录音异常
2、解决部分机器抛出的内存不足错误
---------------------------------------------------------------------
1.1016版本更新信息
1、解决TTS连续播放异常
2、更改默认皮肤
3、优化wap网络成功率
4、优化合成及识别流程提高会话成功率。
---------------------------------------------------------------------
1.1015版本更新信息
1、解决上一版本1.5系统出现的不兼容问题;
2、支持Abnf语法文件上传获得语法ID进行识别
3、解决TTS播放过程中连续调用合成引起的问题。
---------------------------------------------------------------------
1.1013版本更新信息
1、解决Android 4.0部分机型TTS合成颤音的问题
2、处理器支持

@ -1,6 +1,24 @@
<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools">
<!--连接网络权限,用于执行云端语音能力 -->
<uses-permission android:name="android.permission.INTERNET"/>
<!--获取手机录音机使用权限,听写、识别、语义理解需要用到此权限 -->
<uses-permission android:name="android.permission.RECORD_AUDIO"/>
<!--读取网络信息状态 -->
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/>
<!--获取当前wifi状态 -->
<uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
<uses-permission android:name="android.permission.CALL_PHONE"/>
<uses-permission android:name="android.permission.INTERNET"/>
<uses-permission android:name="android.permission.RECORD_AUDIO"/>
<uses-permission android:name="android.permission.ACCESS_COARSE_LOCATION"/>
<uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
<application
android:allowBackup="true"
@ -8,6 +26,7 @@
android:fullBackupContent="@xml/backup_rules"
android:icon="@mipmap/ic_launcher"
android:label="@string/app_name"
android:name=".SpeechApplication"
android:roundIcon="@mipmap/ic_launcher_round"
android:supportsRtl="true"
android:theme="@style/Theme.MyApplication"

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.4 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 14 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 16 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 12 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 7.7 KiB

@ -0,0 +1,140 @@
package com.example.myapplication;
import android.content.Context;
import com.iflytek.cloud.ErrorCode;
import com.iflytek.cloud.SpeechConstant;
import com.iflytek.cloud.SpeechUtility;
import org.json.JSONArray;
import org.json.JSONObject;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
/**
*
*/
public class FucUtil {
/**
* asset
*
* @return content
*/
public static String readFile(Context mContext, String file, String code) {
int len = 0;
byte[] buf = null;
String result = "";
try {
InputStream in = mContext.getAssets().open(file);
len = in.available();
buf = new byte[len];
in.read(buf, 0, len);
result = new String(buf, code);
} catch (Exception e) {
e.printStackTrace();
}
return result;
}
/**
*
*
* @param buffer
* @param length
* @param spsize
* @return
*/
public static ArrayList<byte[]> splitBuffer(byte[] buffer, int length, int spsize) {
ArrayList<byte[]> array = new ArrayList<byte[]>();
if (spsize <= 0 || length <= 0 || buffer == null || buffer.length < length)
return array;
int size = 0;
while (size < length) {
int left = length - size;
if (spsize < left) {
byte[] sdata = new byte[spsize];
System.arraycopy(buffer, size, sdata, 0, spsize);
array.add(sdata);
size += spsize;
} else {
byte[] sdata = new byte[left];
System.arraycopy(buffer, size, sdata, 0, left);
array.add(sdata);
size += left;
}
}
return array;
}
/**
* 线
* 1.PLUS_LOCAL_ALL:
* 2.PLUS_LOCAL_ASR:
* 3.PLUS_LOCAL_TTS:
*/
public static String checkLocalResource() {
String resource = SpeechUtility.getUtility().getParameter(SpeechConstant.PLUS_LOCAL_ASR);
try {
JSONObject result = new JSONObject(resource);
int ret = result.getInt(SpeechUtility.TAG_RESOURCE_RET);
switch (ret) {
case ErrorCode.SUCCESS:
JSONArray asrArray = result.getJSONObject("result").optJSONArray("asr");
if (asrArray != null) {
int i = 0;
// 查询否包含离线听写资源
for (; i < asrArray.length(); i++) {
if ("iat".equals(asrArray.getJSONObject(i).get(SpeechConstant.DOMAIN))) {
//asrArray中包含语言、方言字段后续会增加支持方言的本地听写。
//如:"accent": "mandarin","language": "zh_cn"
break;
}
}
if (i >= asrArray.length()) {
SpeechUtility.getUtility().openEngineSettings(SpeechConstant.ENG_ASR);
return "没有听写资源,跳转至资源下载页面";
}
} else {
SpeechUtility.getUtility().openEngineSettings(SpeechConstant.ENG_ASR);
return "没有听写资源,跳转至资源下载页面";
}
break;
case ErrorCode.ERROR_VERSION_LOWER:
return "语记版本过低,请更新后使用本地功能";
case ErrorCode.ERROR_INVALID_RESULT:
SpeechUtility.getUtility().openEngineSettings(SpeechConstant.ENG_ASR);
return "获取结果出错,跳转至资源下载页面";
case ErrorCode.ERROR_SYSTEM_PREINSTALL:
default:
break;
}
} catch (Exception e) {
SpeechUtility.getUtility().openEngineSettings(SpeechConstant.ENG_ASR);
return "获取结果出错,跳转至资源下载页面";
}
return "";
}
/**
* asset
*
* @return
*/
public static byte[] readAudioFile(Context context, String filename) {
try {
InputStream ins = context.getAssets().open(filename);
byte[] data = new byte[ins.available()];
ins.read(data);
ins.close();
return data;
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

@ -0,0 +1,36 @@
package com.example.myapplication;
import android.os.Bundle;
import android.preference.EditTextPreference;
import android.preference.Preference;
import android.preference.Preference.OnPreferenceChangeListener;
import android.preference.PreferenceActivity;
import android.view.Window;
/**
*
*/
public class IatSettings extends PreferenceActivity implements OnPreferenceChangeListener {
public static final String PREFER_NAME = "com.inflater.setting";
@SuppressWarnings("deprecation")
public void onCreate(Bundle savedInstanceState) {
requestWindowFeature(Window.FEATURE_NO_TITLE);
super.onCreate(savedInstanceState);
getPreferenceManager().setSharedPreferencesName(PREFER_NAME);
addPreferencesFromResource(R.xml.iat_setting);
EditTextPreference mVadbosPreference = (EditTextPreference) findPreference("iat_vadbos_preference");
mVadbosPreference.getEditText().addTextChangedListener(new SettingTextWatcher(IatSettings.this, mVadbosPreference, 0, 10000));
EditTextPreference mVadeosPreference = (EditTextPreference) findPreference("iat_vadeos_preference");
mVadeosPreference.getEditText().addTextChangedListener(new SettingTextWatcher(IatSettings.this, mVadeosPreference, 0, 10000));
}
@Override
public boolean onPreferenceChange(Preference preference, Object newValue) {
return true;
}
}

@ -0,0 +1,117 @@
package com.example.myapplication;
import org.json.JSONArray;
import org.json.JSONObject;
import org.json.JSONTokener;
/**
* Json
*/
public class JsonParser {
public static String parseIatResult(String json) {
StringBuffer ret = new StringBuffer();
try {
JSONTokener tokener = new JSONTokener(json);
JSONObject joResult = new JSONObject(tokener);
JSONArray words = joResult.getJSONArray("ws");
for (int i = 0; i < words.length(); i++) {
// 转写结果词,默认使用第一个结果
JSONArray items = words.getJSONObject(i).getJSONArray("cw");
JSONObject obj = items.getJSONObject(0);
ret.append(obj.getString("w"));
// 如果需要多候选结果,解析数组其他字段
// for(int j = 0; j < items.length(); j++)
// {
// JSONObject obj = items.getJSONObject(j);
// ret.append(obj.getString("w"));
// }
}
} catch (Exception e) {
e.printStackTrace();
}
return ret.toString();
}
public static String parseGrammarResult(String json) {
StringBuffer ret = new StringBuffer();
try {
JSONTokener tokener = new JSONTokener(json);
JSONObject joResult = new JSONObject(tokener);
JSONArray words = joResult.getJSONArray("ws");
for (int i = 0; i < words.length(); i++) {
JSONArray items = words.getJSONObject(i).getJSONArray("cw");
for(int j = 0; j < items.length(); j++)
{
JSONObject obj = items.getJSONObject(j);
if(obj.getString("w").contains("nomatch"))
{
ret.append("没有匹配结果.");
return ret.toString();
}
ret.append("【结果】" + obj.getString("w"));
ret.append("【置信度】" + obj.getInt("sc"));
ret.append("\n");
}
}
} catch (Exception e) {
e.printStackTrace();
ret.append("没有匹配结果.");
}
return ret.toString();
}
public static String parseLocalGrammarResult(String json) {
StringBuffer ret = new StringBuffer();
try {
JSONTokener tokener = new JSONTokener(json);
JSONObject joResult = new JSONObject(tokener);
JSONArray words = joResult.getJSONArray("ws");
for (int i = 0; i < words.length(); i++) {
JSONArray items = words.getJSONObject(i).getJSONArray("cw");
for(int j = 0; j < items.length(); j++)
{
JSONObject obj = items.getJSONObject(j);
if(obj.getString("w").contains("nomatch"))
{
ret.append("没有匹配结果.");
return ret.toString();
}
ret.append("【结果】" + obj.getString("w"));
ret.append("\n");
}
}
ret.append("【置信度】" + joResult.optInt("sc"));
} catch (Exception e) {
e.printStackTrace();
ret.append("没有匹配结果.");
}
return ret.toString();
}
public static String parseTransResult(String json,String key) {
StringBuffer ret = new StringBuffer();
try {
JSONTokener tokener = new JSONTokener(json);
JSONObject joResult = new JSONObject(tokener);
String errorCode = joResult.optString("ret");
if(!errorCode.equals("0")) {
return joResult.optString("errmsg");
}
JSONObject transResult = joResult.optJSONObject("trans_result");
ret.append(transResult.optString(key));
/*JSONArray words = joResult.getJSONArray("results");
for (int i = 0; i < words.length(); i++) {
JSONObject obj = words.getJSONObject(i);
ret.append(obj.getString(key));
}*/
} catch (Exception e) {
e.printStackTrace();
}
return ret.toString();
}
}

@ -0,0 +1,71 @@
package com.example.myapplication;
import android.content.Context;
import android.preference.EditTextPreference;
import android.text.Editable;
import android.text.TextUtils;
import android.text.TextWatcher;
import android.widget.Toast;
import java.util.regex.Pattern;
/**
*
*/
public class SettingTextWatcher implements TextWatcher {
private int editStart;
private int editCount;
private EditTextPreference mEditTextPreference;
int minValue;//最小值
int maxValue;//最大值
private Context mContext;
public SettingTextWatcher(Context context, EditTextPreference e, int min, int max) {
mContext = context;
mEditTextPreference = e;
minValue = min;
maxValue = max;
}
@Override
public void onTextChanged(CharSequence s, int start, int before, int count) {
// Log.e("demo", "onTextChanged start:"+start+" count:"+count+" before:"+before);
editStart = start;
editCount = count;
}
@Override
public void beforeTextChanged(CharSequence s, int start, int count, int after) {
// Log.e("demo", "beforeTextChanged start:"+start+" count:"+count+" after:"+after);
}
@Override
public void afterTextChanged(Editable s) {
if (TextUtils.isEmpty(s)) {
return;
}
String content = s.toString();
// Log.e("demo", "content:"+content);
if (isNumeric(content)) {
int num = Integer.parseInt(content);
if (num > maxValue || num < minValue) {
s.delete(editStart, editStart + editCount);
mEditTextPreference.getEditText().setText(s);
Toast.makeText(mContext, "超出有效值范围", Toast.LENGTH_SHORT).show();
}
} else {
s.delete(editStart, editStart + editCount);
mEditTextPreference.getEditText().setText(s);
Toast.makeText(mContext, "只能输入数字哦", Toast.LENGTH_SHORT).show();
}
}
/**
* -
*/
public static boolean isNumeric(String str) {
Pattern pattern = Pattern.compile("[0-9]*");
return pattern.matcher(str).matches();
}
};

@ -0,0 +1,18 @@
package com.example.myapplication;
import android.app.Application;
import com.iflytek.cloud.SpeechUtility;
public class SpeechApplication extends Application {
@Override
public void onCreate() {
// 5ef048e1 为在开放平台注册的APPID 注意没有空格,直接替换即可
SpeechUtility.createUtility(SpeechApplication.this, "appid=6d0c39e4");
super.onCreate();
}
}

@ -2,10 +2,11 @@ package com.example.myapplication;
import androidx.appcompat.app.AppCompatActivity;
import android.annotation.SuppressLint;
import android.content.Intent;
import android.net.Uri;
import android.os.Build;
import android.os.Bundle;
import android.provider.ContactsContract;
import android.view.View;
import android.widget.Button;
@ -15,10 +16,12 @@ public class yijiantong extends AppCompatActivity {
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_yijiantong);
if (shouldAskPermissions()) {
askPermissions();
}
Button button1=findViewById(R.id.button1);
Button button1 = findViewById(R.id.button1);
//点击
button1.setOnClickListener(new View.OnClickListener() {
@Override
@ -30,7 +33,7 @@ public class yijiantong extends AppCompatActivity {
}
});
Button button2=findViewById(R.id.button2);
Button button2 = findViewById(R.id.button2);
//点击
button2.setOnClickListener(new View.OnClickListener() {
@Override
@ -41,7 +44,7 @@ public class yijiantong extends AppCompatActivity {
}
});
Button button3=findViewById(R.id.button3);
Button button3 = findViewById(R.id.button3);
//点击
button3.setOnClickListener(new View.OnClickListener() {
@Override
@ -52,7 +55,7 @@ public class yijiantong extends AppCompatActivity {
}
});
Button button4=findViewById(R.id.button4);
Button button4 = findViewById(R.id.button4);
//点击
button4.setOnClickListener(new View.OnClickListener() {
@Override
@ -62,10 +65,10 @@ public class yijiantong extends AppCompatActivity {
startActivity(intent);
}
});[]
});
Button button5=findViewById(R.id.button5);
Button button5 = findViewById(R.id.button5);
//点击
button5.setOnClickListener(new View.OnClickListener() {
@Override
@ -76,7 +79,7 @@ public class yijiantong extends AppCompatActivity {
}
});
Button button6=findViewById(R.id.button6);
Button button6 = findViewById(R.id.button6);
//点击
button6.setOnClickListener(new View.OnClickListener() {
@Override
@ -87,6 +90,53 @@ public class yijiantong extends AppCompatActivity {
}
});
Button button7 = findViewById(R.id.button8);
//点击
button7.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View view) {
Intent addIntent = new Intent(Intent.ACTION_INSERT, Uri.withAppendedPath(Uri.parse("content://com.android.contacts"), "contacts"));
addIntent.setType("vnd.android.cursor.dir/person");
addIntent.setType("vnd.android.cursor.dir/contact");
addIntent.setType("vnd.android.cursor.dir/raw_contact");
boolean number = false;
addIntent.putExtra(ContactsContract.Intents.Insert.NAME, number);
boolean numberForNewConstant = false;
addIntent.putExtra(android.provider.ContactsContract.Intents.Insert.PHONE, numberForNewConstant);
startActivity(addIntent);
}
});
Button button8 = findViewById(R.id.button7);
//点击
button8.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View view) {
//调用系统方法拨打电话
Intent intent = new Intent();
intent.setAction(Intent.ACTION_CALL);
intent.setData(Uri.parse("tel:" + "15607989193"));
startActivity(intent);
}
});
}
private boolean askPermissions() {
return (Build.VERSION.SDK_INT > Build.VERSION_CODES.LOLLIPOP_MR1);
}
private boolean shouldAskPermissions() {
String[] permissions = {
"android.permission.CALL_PHONE"
};
int requestCode = 200;
if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.M) {
requestPermissions(permissions, requestCode);
}
return true;
}
}

@ -1,14 +1,256 @@
package com.example.myapplication;
import androidx.appcompat.app.AppCompatActivity;
import androidx.core.app.ActivityCompat;
import androidx.core.content.ContextCompat;
import android.Manifest;
import android.annotation.SuppressLint;
import android.app.Activity;
import android.content.SharedPreferences;
import android.content.pm.PackageManager;
import android.os.Build;
import android.os.Bundle;
import android.os.Environment;
import android.os.Handler;
import android.os.Message;
import android.util.Log;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;
import android.widget.Toast;
public class yuyin extends AppCompatActivity {
import com.iflytek.cloud.ErrorCode;
import com.iflytek.cloud.InitListener;
import com.iflytek.cloud.RecognizerListener;
import com.iflytek.cloud.RecognizerResult;
import com.iflytek.cloud.SpeechConstant;
import com.iflytek.cloud.SpeechError;
import com.iflytek.cloud.SpeechRecognizer;
import com.iflytek.cloud.ui.RecognizerDialog;
import com.iflytek.cloud.ui.RecognizerDialogListener;
import org.json.JSONException;
import org.json.JSONObject;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.LinkedHashMap;
public class yuyin extends AppCompatActivity implements View.OnClickListener {
private static final String TAG = "MainActivity";
private SpeechRecognizer mIat;// 语音听写对象
private RecognizerDialog mIatDialog;// 语音听写UI
// 用HashMap存储听写结果
private HashMap<String, String> mIatResults = new LinkedHashMap<String, String>();
private SharedPreferences mSharedPreferences;//缓存
private String mEngineType = SpeechConstant.TYPE_CLOUD;// 引擎类型
private String language = "zh_cn";//识别语言
private TextView tvResult;//识别结果
private Button btnStart;//开始识别
private String resultType = "json";//结果内容数据格式
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_yuyin);
tvResult = findViewById(R.id.tv_result);
btnStart = findViewById(R.id.btn_start);
btnStart.setOnClickListener(this);
initPermission();//权限请求
// 使用SpeechRecognizer对象可根据回调消息自定义界面
mIat = SpeechRecognizer.createRecognizer(yuyin.this, mInitListener);
// 使用UI听写功能请根据sdk文件目录下的notice.txt,放置布局文件和图片资源
mIatDialog = new RecognizerDialog(yuyin.this, mInitListener);
mSharedPreferences = getSharedPreferences("ASR",
Activity.MODE_PRIVATE);
}
@Override
public void onClick(View v) {
if( null == mIat ){
// 创建单例失败,与 21001 错误为同样原因,参考 http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=9688
showMsg( "创建对象失败,请确认 libmsc.so 放置正确,且有调用 createUtility 进行初始化" );
return;
}
mIatResults.clear();//清除数据
setParam(); // 设置参数
mIatDialog.setListener(mRecognizerDialogListener);//设置监听
mIatDialog.show();// 显示对话框
}
/**
*
*/
private InitListener mInitListener = new InitListener() {
@Override
public void onInit(int code) {
Log.d(TAG, "SpeechRecognizer init() code = " + code);
if (code != ErrorCode.SUCCESS) {
showMsg("初始化失败,错误码:" + code + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案");
}
}
};
/**
* UI
*/
private RecognizerDialogListener mRecognizerDialogListener = new RecognizerDialogListener() {
public void onResult(RecognizerResult results, boolean isLast) {
printResult(results);//结果数据解析
}
/**
* .
*/
public void onError(SpeechError error) {
showMsg(error.getPlainDescription(true));
}
};
/**
*
*
* @param results
*/
private void printResult(RecognizerResult results) {
String text = JsonParser.parseIatResult(results.getResultString());
String sn = null;
// 读取json结果中的sn字段
try {
JSONObject resultJson = new JSONObject(results.getResultString());
sn = resultJson.optString("sn");
} catch (JSONException e) {
e.printStackTrace();
}
mIatResults.put(sn, text);
StringBuffer resultBuffer = new StringBuffer();
for (String key : mIatResults.keySet()) {
resultBuffer.append(mIatResults.get(key));
}
tvResult.setText(resultBuffer.toString());//听写结果显示
}
/**
*
*
* @return
*/
public void setParam() {
// 清空参数
mIat.setParameter(SpeechConstant.PARAMS, null);
// 设置听写引擎
mIat.setParameter(SpeechConstant.ENGINE_TYPE, mEngineType);
// 设置返回结果格式
mIat.setParameter(SpeechConstant.RESULT_TYPE, resultType);
if (language.equals("zh_cn")) {
String lag = mSharedPreferences.getString("iat_language_preference",
"mandarin");
Log.e(TAG, "language:" + language);// 设置语言
mIat.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
// 设置语言区域
mIat.setParameter(SpeechConstant.ACCENT, lag);
} else {
mIat.setParameter(SpeechConstant.LANGUAGE, language);
}
Log.e(TAG, "last language:" + mIat.getParameter(SpeechConstant.LANGUAGE));
//此处用于设置dialog中不显示错误码信息
//mIat.setParameter("view_tips_plain","false");
// 设置语音前端点:静音超时时间,即用户多长时间不说话则当做超时处理
mIat.setParameter(SpeechConstant.VAD_BOS, mSharedPreferences.getString("iat_vadbos_preference", "4000"));
// 设置语音后端点:后端点静音检测时间,即用户停止说话多长时间内即认为不再输入, 自动停止录音
mIat.setParameter(SpeechConstant.VAD_EOS, mSharedPreferences.getString("iat_vadeos_preference", "1000"));
// 设置标点符号,设置为"0"返回结果无标点,设置为"1"返回结果有标点
mIat.setParameter(SpeechConstant.ASR_PTT, mSharedPreferences.getString("iat_punc_preference", "1"));
// 设置音频保存路径保存音频格式支持pcm、wav设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限
mIat.setParameter(SpeechConstant.AUDIO_FORMAT, "wav");
mIat.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory() + "/msc/iat.wav");
}
/**
*
* @param msg
*/
private void showMsg(String msg) {
Toast.makeText(yuyin.this, msg, Toast.LENGTH_SHORT).show();
}
@Override
protected void onDestroy() {
super.onDestroy();
if (null != mIat) {
// 退出时释放连接
mIat.cancel();
mIat.destroy();
}
}
/**
* android 6.0
*/
private void initPermission() {
String permissions[] = {Manifest.permission.RECORD_AUDIO,
Manifest.permission.ACCESS_NETWORK_STATE,
Manifest.permission.INTERNET,
Manifest.permission.WRITE_EXTERNAL_STORAGE
};
ArrayList<String> toApplyList = new ArrayList<String>();
for (String perm : permissions) {
if (PackageManager.PERMISSION_GRANTED != ContextCompat.checkSelfPermission(this, perm)) {
toApplyList.add(perm);
}
}
String tmpList[] = new String[toApplyList.size()];
if (!toApplyList.isEmpty()) {
ActivityCompat.requestPermissions(this, toApplyList.toArray(tmpList), 123);
}
}
/**
*
*
* @param requestCode
* @param permissions
* @param grantResults
*/
@Override
public void onRequestPermissionsResult(int requestCode, String[] permissions, int[] grantResults) {
// 此处为android 6.0以上动态授权的回调,用户自行实现。
super.onRequestPermissionsResult(requestCode, permissions, grantResults);
}
}

Binary file not shown.

After

Width:  |  Height:  |  Size: 4.5 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 3.8 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 2.3 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 3.3 KiB

@ -0,0 +1,9 @@
<?xml version="1.0" encoding="utf-8"?>
<selector xmlns:android="http://schemas.android.com/apk/res/android">
<item android:drawable="@drawable/setting" android:state_focused="true" android:state_pressed="false" />
<item android:drawable="@drawable/setting_p" android:state_focused="true" android:state_pressed="true" />
<item android:drawable="@drawable/setting_p" android:state_focused="false" android:state_pressed="true" />
<item android:drawable="@drawable/setting"></item>
</selector>

Binary file not shown.

After

Width:  |  Height:  |  Size: 4.4 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 2.1 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.7 KiB

@ -0,0 +1,13 @@
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:layout_width="match_parent"
android:layout_height="match_parent"
tools:context=".class1">
<ListView
android:id="@+id/lv_main_list"
android:layout_width="match_parent"
android:layout_height="match_parent"></ListView>
</LinearLayout>

@ -1,25 +1,25 @@
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:app="http://schemas.android.com/apk/res-auto"
xmlns:tools="http://schemas.android.com/tools"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:orientation="vertical">
android:gravity="center"
android:orientation="vertical"
tools:context=".yuyin">
<Button
<TextView
android:id="@+id/tv_result"
android:layout_width="wrap_content"
android:layout_height="70dp"
android:text="开始语音识别"
android:textSize="30sp"
android:gravity="left"></Button>
android:layout_height="wrap_content"
android:text="识别到的内容"
android:textColor="#000" />
<Button
android:id="@+id/btn_start"
android:layout_width="wrap_content"
android:layout_height="70dp"
android:text="查看语音识别结果"
android:textSize="30sp"
android:gravity="left"></Button>
android:layout_height="wrap_content"
android:layout_marginTop="20dp"
android:text="开始识别" />
</LinearLayout>

@ -0,0 +1,14 @@
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:app="http://schemas.android.com/apk/res-auto"
xmlns:tools="http://schemas.android.com/tools"
android:layout_width="match_parent"
android:layout_height="match_parent"
tools:context=".MainActivity">
<ListView
android:id="@+id/lv_main_list"
android:layout_width="match_parent"
android:layout_height="match_parent"></ListView>
</LinearLayout>

@ -0,0 +1,9 @@
<?xml version="1.0" encoding="utf-8"?>
<resources>
<string-array name="iat_language_value" />
<string-array name="iat_language_entries" />
<string-array name="language_values" />
<string-array name="language_entries" />
<string-array name="punc_entries" />
<string-array name="punc_values" />
</resources>

@ -0,0 +1,11 @@
<?xml version="1.0" encoding="utf-8"?>
<resources>
<dimen name="margin_">10dp</dimen>
<dimen name="pading_">5dp</dimen>
<dimen name="btn_size">22sp</dimen>
<dimen name="txt_size">18sp</dimen>
<!-- 分割线高度 -->
<dimen name="line_height">1dp</dimen>
</resources>

@ -0,0 +1,18 @@
<?xml version="1.0" encoding="utf-8"?>
<resources>
<style name="dialog" parent="@android:style/Theme.Dialog">
<item name="android:windowFrame">@null</item>
<item name="android:windowIsFloating">true</item>
<item name="android:windowIsTranslucent">true</item>
<item name="android:windowNoTitle">true</item>
<item name="android:background">@android:color/transparent</item>
<item name="android:windowBackground">@android:color/transparent</item>
<item name="android:backgroundDimEnabled">true</item>
<item name="android:backgroundDimAmount">0.6</item>
</style>
<style name="textStyle">
<item name="android:textSize">16sp</item>
</style>
</resources>

@ -0,0 +1,6 @@
<?xml version="1.0" encoding="utf-8"?>
<paths xmlns:android="http://schemas.android.com/apk/res/android">
<external-path
name="my_images"
path="."/>
</paths>

@ -0,0 +1,39 @@
<?xml version="1.0" encoding="utf-8"?>
<PreferenceScreen xmlns:android="http://schemas.android.com/apk/res/android">
<ListPreference
android:key="iat_language_preference"
android:title="语言设置"
android:entries="@array/language_entries"
android:entryValues="@array/language_values"
android:summary="支持:普通话,粤语,英语 "
android:defaultValue="mandarin" />
<EditTextPreference
android:key="iat_vadbos_preference"
android:title="前端点超时"
android:dialogTitle="请输入时间(0-10000)ms"
android:summary="默认值短信转写5000其他4000"
android:defaultValue="5000" />
<EditTextPreference
android:key="iat_vadeos_preference"
android:title="后端点超时"
android:dialogTitle="请输入时间(0-10000)ms"
android:summary="默认值短信转写1800其他700 "
android:defaultValue="1800" />
<ListPreference
android:key="iat_punc_preference"
android:title="标点符号"
android:entries="@array/punc_entries"
android:entryValues="@array/punc_values"
android:summary="默认值:有标点 "
android:defaultValue="1" />
<CheckBoxPreference
android:key="@string/pref_key_iat_show"
android:title="@string/pref_title_iat_show"
android:defaultValue="true" />
</PreferenceScreen>
Loading…
Cancel
Save