SSTG: Enhancing Code-Switching Speech Recognition via Semi-Supervised Mandarin-English Text Generation

Paper Information

Paper ID: FETC25-068

Type: Full Paper

Date: Sep 07, 2025

Status: Accepted

Paper Details

Abstract

Language models (LMs) play a crucial role in low-resource automatic speech recognition (ASR), particularly in code-switching scenarios where multiple languages are interleaved within a single utterance or conversation. These scenarios are often challenged by a lack of sufficient annotated training data. To mitigate this limitation, common strategies include leveraging multilingual pretraining, fine-tuning on linguistically related languages, and generating synthetic code-switched text from monolingual data. In this paper, we propose a novel method, Semi-Supervised Text Generation (SSTG), aimed at enhancing Mandarin-English code-switching speech recognition (CSSR). Our approach utilizes a semi-supervised acoustic model to generate synthetic code-switched transcriptions from untranscribed audios. The SEAME Mandarin-English code-switching corpus is used as supervised training data, while Part IV of the National Speech Corpus (NSC) serves as the source of untranscribed input. Experimental results demonstrate that the quality of the generated text is comparable to that of manually annotated transcripts, highlighting the effectiveness of our approach in improving language modeling for code-switching speech recognition.

Keywords

Language Model Semi-Supervised Learning Code-Switching Speech Recognition Text Generation

Contact Information

Cao Hong Nga (Corresponding Author)

FPT University, Can Tho, Vietnam., Vietnam

caohongnga@gmail.com

0942150108

All Authors (1)

Cao Hong Nga C

Affiliation: FPT University, Can Tho, Vietnam.

Country: Vietnam

Email: caohongnga@gmail.com

Phone: 0942150108

Back to Accepted Papers

Latest News

There are no new news updates at the moment.

Important dates

Submission Deadline: ~~June 30, 2025~~ July 31, 2025 (Firm Deadline)
Notification of Acceptance: August 15, 2025
Camera Ready Submission: September 10, 2025
Registration Deadline and Fee Payment: September 15, 2025
Conference Dates: October 25-26, 2025

Conference Fee

International Authors/Listeners

Registration Type	Region	Inclusive Package
Registration Type	International	Include Gala dinner	Include Academic tour
Author (Regular)	300 USD	Yes	Yes
Author (Student)	250 USD	Yes	Yes
Author (Industry/Poster)	300 USD	Yes	Yes
Listener	100 USD	Yes	Yes

Domestic Authors/Listeners

Registration Type	Region	Inclusive Package
Registration Type	Vietnam	Include Gala dinner	Include Academic tour
Author (Regular)	5,000,000 VND	Yes	Yes
Author (Student)	4,500,000 VND	Yes	Yes
Author (Industry/Poster)	5,000,000 VND	Yes	Yes
Listener	1,000,000 VND	Yes	Yes

Contact

Website: science.fpt.edu.vn/fetc
Phone: +84 2466549806
Email: FETC@fe.edu.vn

Keynote Speakers

Prof. Natalia Loukachevitch
Lomonosov Moscow State University (MSU), Russia
Prof. Long Tran-Thanh
University of Warwick, United Kingdom
Dr. Long Duong
Oracle, Australia

Conference Themes

AI Solution for Developing Countries

Data Availability and Quality
Energy Efficiency and Optimization
Edge Computing and Decentralization
NLP for Low-resource Languages
Image and Video Understanding
Machine Learning Applications

Important dates

Submission Deadline: ~~June 30, 2025~~ July 31, 2025 (Firm Deadline)
Notification of Acceptance: August 15, 2025
Camera Ready Submission: September 10, 2025
Registration Deadline and Fee Payment: September 15, 2025
Conference Dates: October 25-26, 2025

Version: 1.0.9428.17720