Unsupervised audio segmentation using extended Baum-Welch transformations

Tara N. Sainath; Dimitri Kanevsky; Giridharan Iyengar

doi:10.1109/ICASSP.2007.366653

Publication

ICASSP 2007

Conference paper

Unsupervised audio segmentation using extended Baum-Welch transformations

ICASSP 2007

View publication

Abstract

Audio segmentation has applications in a variety of contexts, such as audio information retrieval, automatic Sound analysis, and as a pre-processing step in speech recognition. Extended Baum-Welch (EBW) transformations are most commonly used as a discriminative technique for estimating parameters of Gaussian mixtures. In this paper, we derive an unsupervised audio segmentation approach using these transformations, We find that our algorithm outperforms both the Bayesian Information. Criterion (BIC) and Cumulative Sum (CUSUM) segmentation methods. In particular, our EBW segmentation algorithm provides improvements over the baseline approaches in detecting landmarks of short duration and minimizing landmark oversegmentation. In addition, we show that the EBW approach provides faster computation compared to the baseline methods. © 2007 IEEE.

Date

06 Aug 2007

Publication

ICASSP 2007

Authors

IBM-affiliated at time of publication

Abstract

Date

Publication

Authors

Share