MagicData
SIGN IN

文件大小:1.13GB

概览

数据集类型

ASR音频数据集

语种

yue-Guangdong,粤语(中国广东)

语音类型

朗读式独白

内容

命令控制、数字串

音频参数

16 kHz,16 bits,双通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

车载

授权方式

Magic Data
open-source license

开源数据集
ASR数据集
5小时

ASR-SCCantCabSC: A Scripted Chinese Cantonese (Canton) Cabin Speech Corpus

总时长为5小时的车载环境广式粤语朗读语音音频和转写文本

此数据集包含了5个小时的广式粤语朗读音频和转写文本,内容为车载环境中的数字串与命令控制,包含6,219条由10名说话人提供的语料。

样本:

" 世纪大道塞唔塞车啊 "

概览

数据集类型

ASR音频数据集

语种

yue-Guangdong,粤语(中国广东)

语音类型

朗读式独白

内容

命令控制、数字串

音频参数

16 kHz,16 bits,双通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

车载

授权方式

Magic Data
open-source license

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email