MagicHub - Datasets Download | Open-Source Datasets

Articles

New Open-Source Release | Chuan-Yu 12-City Sub-Dialect Speech Dataset: Helping Large Models Understand the Living Voices of Sichuan and Chongqing

Magic Data Open-Sources Five Dialect TTS Datasets: Native Speakers Aged 30–60 Bring Authentic Chinese Regional Voices to Life

Day 1 Highlights from ICASSP 2026

What ASR Still Gets Wrong: A Closer Look at Real-World Failures

Global Data for Voice Agent Meetup Launches | Debut in Singapore

Developing Emotionally Intelligent AI: Magic Data Releases a Multi-Speaker Emotional Speech Dataset

Find Datasets in Magichub

Quick Recommanded

Download Rank

ASR-RAMC-BigCCSC: A Chinese Conversational Speech Corpus

Multi-Modal Driver Behaviors Dataset for DMS

ASR-SCCantDuSC: A Scripted Chinese Cantonese (Canton) Daily-use Speech Corpus

ASR-SCSichDiaDuSC: A Scripted Chinese Sichuan Dialect Daily-use Speech Corpus

ASR-CCantCSC: A Chinese Cantonese (Canton) Conversational Speech Corpus

ASR-SCCantCabSC: A Scripted Chinese Cantonese (Canton) Cabin Speech Corpus

ASR-EgArbCSC: An Egyptian Arabic Conversational Speech Corpus

ASR-CShhiDiaCSC: A Chinese Shanghai Dialect Conversational Speech Corpus

ASR-SCShhiDiaDuSC: A Scripted Chinese Shanghai Dialect Daily-use Speech Corpus

Recent

Chuan-Yu 12-City Sub-dialect Speech Dataset

MagicData-Dialect-Cantonese-TTS-Lite

MagicData-Dialect-Wu Chinese-TTS-Lite

MagicData-Dialect-Sichuanese-TTS-Lite

MagicData-Dialect-Henan Dialect-TTS-Lite

MagicData-Dialect-Northeastern Chinese-TTS-Lite

ENV-RWCP: A Sound Scene Database

Multi-speaker Emotional Speech Dataset

Datasets Customized Service

Magichub is an open source datasets community, while Magic Data still running commercial dataset producing business, including Data Gathering, Labeling, and Annotation Platform Deployment.

Free datasets in Magichub is on puepose for basic modeling training / validation / testing. In mean while customizing specific datasets is possible.

Just feel free telling us your demand, and once the message received, we would contact you as soon as possible.

©Copyright 2017- 2025 by Magic Data Technology (北京晴数智慧科技有限公司). All Rights Reserved.

备案号: 京ICP备18008050号-6号

京公网安备 11010802035822号

Your IP is: 216.73.216.191