MagicData
SIGN IN

Total Size: 355 MB

概览

数据集类型

语音识别(ASR)音频数据集

语种

yue-Guangdong, 粤语(中国广东)

语音类型

室内

内容

日常用语

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内

授权方式

Magic Data
open-source license

开源数据集
ASR数据集

ASR-SCCantDuSC: A Scripted Chinese Cantonese (Canton) Daily-use Speech Corpus

总时长为4.06小时的广式粤语朗读语音音频和转写文本,
on daily use sentences

此数据集包含了4.06个小时的广式粤语朗读音频和转写文本,内容为由10名说话人提供的4,060条日常用语语料。

样本:

"我请你食饭两个人几好早啲瞓。"

Citation Format:ASR-SCCANTDUSC: A SCRIPTED CHINESE CANTONESE (CANTON) DAILY-USE SPEECH CORPUS. 2021. https://magichub.com/datasets/guangzhou-cantonese-scripted-speech-corpus-daily-use-sentence/ . Beijing Magic Data Technology Co., Ltd.

概览

数据集类型

语音识别(ASR)音频数据集

语种

yue-Guangdong, 粤语(中国广东)

语音类型

室内

内容

日常用语

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内

授权方式

Magic Data
open-source license

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email