Total Size: 436.14 MB

Dataset Overview

Dataset Type

ASR speech corpus

Language

cmn-Wuhan,
Mandarin Chinese (Wuhan, China)

Speech Style

indoor environment

Content

daily use sentences

Audio Parameters

16 kHz, 16 bits, mono

File Format

WAV (PCM)
TXT (UTF-8)

Recording Equipment

mobile

Recording Environment

indoor environment

License

Magic Data
open-source license

Open Source

ASR Corpus

5.08 hours

ASR-SCWuhDiaDuSC: A Scripted Chinese Wuhan Dialect Daily-use Speech Corpus

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

5.08 hours of transcribed Wuhan dialect scripted speech
on daily use sentences

This open-source dataset consists of 5.08 hours of transcribed Wuhan dialect scripted speech focusing on daily use sentences, where 5,082 utterances contributed by four speakers were contained.

Sample:

"洛阳四院的紧急电话是多少"

Dataset Overview

Dataset Type

ASR speech corpus

Language

cmn-Wuhan,
Mandarin Chinese (Wuhan, China)

Speech Style

indoor environment

Content

daily use sentences

Audio Parameters

16 kHz, 16 bits, mono

File Format

WAV (PCM)
TXT (UTF-8)

Recording Equipment

mobile

Recording Environment

indoor environment

License

Magic Data
open-source license

备案号: 京ICP备18008050号-6号

京公网安备 11010802035822号

Your IP is: 216.73.217.87

SIGN IN

SIGN UP

Total Size: 436.14 MB

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Data
open-source license

ASR-SCWuhDiaDuSC: A Scripted Chinese Wuhan Dialect Daily-use Speech Corpus

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Data
open-source license

京公网安备 11010802035822号

SIGN IN

SIGN UP

Total Size: 436.14 MB

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Dataopen-source license

ASR-SCWuhDiaDuSC: A Scripted Chinese Wuhan Dialect Daily-use Speech Corpus

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Dataopen-source license

京公网安备 11010802035822号

Verifying Email

Magic Data
open-source license

Magic Data
open-source license