Total Size: 355 MB

Dataset Overview

Dataset Type

ASR speech corpus

Language

yue-Guangdong,
Yue Chinese (Guangdong, China)

Speech Style

indoor environment

Content

daily use sentences

Audio Parameters

16 kHz, 16 bits, mono

File Format

WAV (PCM)
TXT (UTF8)

Recording Equipment

mobile

Recording Environment

indoor environment

License

Magic Data
open-source license

Open Source

ASR Corpus

ASR-SCCantDuSC: A Scripted Chinese Cantonese (Canton) Daily-use Speech Corpus

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

4.06 hours of transcribed Guangzhou Cantonese scripted speech
on daily use sentences

This open-source dataset consists of 4.06 hours of transcribed Guangzhou Cantonese scripted speech focusing on daily use sentences, where 4,060 utterances contributed by ten speakers were contained.

Sample:

"我请你食饭两个人几好早啲瞓。"

Citation Format：ASR-SCCANTDUSC: A SCRIPTED CHINESE CANTONESE (CANTON) DAILY-USE SPEECH CORPUS. 2021. https://magichub.com/datasets/guangzhou-cantonese-scripted-speech-corpus-daily-use-sentence/ . Beijing Magic Data Technology Co., Ltd.

Dataset Overview

Dataset Type

ASR speech corpus

Language

yue-Guangdong,
Yue Chinese (Guangdong, China)

Speech Style

indoor environment

Content

daily use sentences

Audio Parameters

16 kHz, 16 bits, mono

File Format

WAV (PCM)
TXT (UTF8)

Recording Equipment

mobile

Recording Environment

indoor environment

License

Magic Data
open-source license

备案号: 京ICP备18008050号-6号

京公网安备 11010802035822号

Your IP is: 216.73.217.30

SIGN IN

SIGN UP

Total Size: 355 MB

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Data
open-source license

ASR-SCCantDuSC: A Scripted Chinese Cantonese (Canton) Daily-use Speech Corpus

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Data
open-source license

京公网安备 11010802035822号

SIGN IN

SIGN UP

Total Size: 355 MB

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Dataopen-source license

ASR-SCCantDuSC: A Scripted Chinese Cantonese (Canton) Daily-use Speech Corpus

Dataset Overview

Dataset Type

Language

Speech Style

Content

Audio Parameters

File Format

Recording Equipment

Recording Environment

License

Magic Dataopen-source license

京公网安备 11010802035822号

Verifying Email

Magic Data
open-source license

Magic Data
open-source license