声纹识别kaldi callhome diarization怎么实现
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,
千家信息网最后更新 2025年12月01日声纹识别kaldi callhome diarization怎么实现
这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"声纹识别kaldi callhome diarization怎么实现"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
callhome diarization kaldi 中专门用来进行混合录音文件聚类分别的
学会自己看kaldi中的 指令demo。
个人操作如下:
teps/segmentation/detect_speech_activity.sh --cmd 'run.pl' --nj 1 --mfcc-config ./conf/mfcc_hires.conf --extra-left-context 79 --extra-right-context 21 --extra-left-context-initial 0 --extra-right-context-final 0 --frames-per-chunk 150 data/ljj exp/segmentation_1a/tdnn_stats_asr_sad_1a exp/mfcc_hires exp/segmentation_sad_snr/nnet_tdnn_j_ljj data/ljj steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 1 --cmd "run.pl" --write-utt2num-frames true data/ljj_seg exp/make_mfcc mfcc utils/fix_data_dir.sh data/ljj_seg # 倒谱均值方差归一化(CMVN) local/nnet3/xvector/prepare_feats.sh --nj 1 --cmd "run.pl" data/ljj_seg data/ljj_seg_cmn exp/ljj_seg_cmn cp data/ljj_seg/segments data/ljj_seg_cmn/ utils/fix_data_dir.sh data/ljj_seg_cmn diarization/nnet3/xvector/extract_xvectors.sh --cmd "run.pl" --nj 1 --window 1.5 --period 0.75 --apply-cmn false --min-segment 0.5 exp/xvector_nnet_1a data/ljj_seg_cmn exp/xvectors_ljj_seg diarization/nnet3/xvector/score_plda.sh --cmd "run.pl --mem 4G" --nj 1 --target-energy 0.9 exp/xvector_nnet_1a/xvectors_callhome1 exp/xvectors_ljj_seg exp/xvectors_ljj_seg/plda_scores diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --reco2num-spk data/ljj_seg/reco2num_spk exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_num_speakers # 如果知道有多少人说话 则需要生成 --reco2num-spk data/ljj_seg/reco2num_spk diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --threshold 0 exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_threshold_0 第二列是文件名,第三列是开始时间,第四列是移动时间 第五列是 从移动时间开始 多少时间算一份 第八列是文件的label如下是 已知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.5101 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 2 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 如下是 不知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.510 1 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 3 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 接下来就是 用pydub 进行语音片段的拼接了
到此,关于"声纹识别kaldi callhome diarization怎么实现"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
文件
时间
学习
个人
接下来
时候
更多
帮助
移动
实用
均值
就是
指令
文件名
文章
方差
方法
片段
理论
知识
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全密钥匙不正确
国家统计局是什么数据库
数据库 801端口
泰拉瑞亚手机版怎么查看自己的服务器ip
杭州数据库培训学费
2003 服务器 iso
云端比本地服务器安全吗
cmmi 软件开发人员职责
三级数据库考试环境
日本的网络安全大学有
svn 数据库实现
福州大学万德数据库
工控软件开发简答题
三级网络技术包括哪些
初中学校网络安全管理
银行软件开发环境
学校网络安全领导小组职责
深圳共赢网络技术有限公司
vfp中数据库表取值命令
联想 x86服务器
爱客宝网络技术有限公司法人
网络视频服务器1路
泰拉瑞亚手机版怎么查看自己的服务器ip
外文数据库
网络工程怎样转软件开发
聪汇互联网科技有限公司
服务器分之8 2
数据库项目实施报告
初中学校网络安全管理
网络安全法考试答案免费