Adaptive Phoneme State Learning Architecture for Enhanced Speech Recognition Using Backpropagation Neural Network and Hidden Markov Model [version 2; peer review: 2 approved, 1 not approved]

Дата публикации: 03-06-2026 12:16:20

Speech remains a primary mode of human communication; however, automated speech recognition (ASR) systems face challenges from accent variability, temporal fluctuations, noise, and data privacy concerns. This paper proposes an enhanced ASR architecture incorporating an Adaptive Phoneme State Learning (APSL) algorithm with a Backpropagation Neural Network (BPNN) and Hidden Markov Model (HMM). APSL dynamically adjusts HMM state probabilities using phoneme confidence scores derived from the BPNN, thereby improving phoneme transition modeling and alignment. The multi-stage ASR pipeline includes noise reduction, speech-pause detection, and feature extraction via framing and windowing. APSL’s adaptive mechanism reduces ambiguities in phoneme transitions, resulting in a more accurate speech-to-text conversion. A comparative evaluation framework assesses the baseline HMM, standalone BPNN, and integrated APSL-BPNN-HMM model. Experiments were conducted using a custom-built dataset of 2000 audio files alongside five benchmark corpora: BNC, ANC, COCA, Buckeye, and Emu. Key evaluation metrics—recall, precision, F-score, and Word Error Rate (WER)—demonstrate that the APSL-enhanced model significantly outperforms baseline systems, achieving 95.7% recall, 92.95% precision, 94.53% F-score, and 96% overall accuracy. Notably, APSL-BPNN-HMM consistently yielded the lowest WER across all datasets, validating its effectiveness. This work highlights the benefits of adaptive learning in probabilistic frameworks for achieving robust and accurate speech recognition.

Схожие новости

#	Наименование новости	Информативность	Дата публикации
1	Malware Detection Using RNA Encoding and Convolutional Neural Networks on the Malicious Network Dataset [version 3; peer review: 2 approved]	7	03-06-2026
2	Нейронные аудиокодеки: мощное сжатие звука с помощью LLM	0	15-06-2026
3	Some Results of Fermatean Fuzzy Set on Subalgebras and Ideals of Bn-Algebras [version 2; peer review: 2 approved]	7	07-05-2026
4	Группа «Т-Технологии» выложила в открытый доступ потоковую модель распознавания речи на русском языке	0	22-07-2025
5	В Югре нейросеть научили озвучивать мансийские фразы	0	20-06-2026
6	Oral Health–Related Quality of Life and Patient-Reported Outcomes After Implant Rehabilitation Using CAS Kit–Assisted Indirect Maxillary Sinus Augmentation: A Longitudinal Observational Study [version 2; peer review: 2 approved, 1 approved with reservations]	7	25-05-2026
7	Компания Canonical представила систему распознавания речи Myna	0	17-06-2026
8	NoiseWorks Audio add Mouth De-Click to VoiceAssist	5	24-06-2026
9	Совершенствование системы планово-предупредительных ремонтов на гидроэлектростанциях за счет использования алгоритмов диагностики фактического технического состояния оборудования	0	01-01-1970
10	Next-generation database reduces AI hallucinations and improves accuracy by 78%	0	19-06-2026

Классификация: Пресс-релизы. Схожих патентов: 0. Схожих новостей: 10. Тональность: 0. Информативность: 7. Источник: f1000research.com.

Просмотр новости

Найдите то, что Вас интересует

Adaptive Phoneme State Learning Architecture for Enhanced Speech Recognition Using Backpropagation Neural Network and Hidden Markov Model [version 2; peer review: 2 approved, 1 not approved]

Дата публикации: 03-06-2026 12:16:20

Схожие новости