Skip to content
Blog
数据集
竞赛
Annotator®
关于我们
Menu
Blog
数据集
竞赛
Annotator®
关于我们
Blog
数据集
竞赛
Annotator®
关于我们
SIGN IN
注册
Menu
Blog
数据集
竞赛
Annotator®
关于我们
SIGN IN
注册
SIGN IN
注册
文件大小:1.13GB
Sign in to download
概览
数据集类型
ASR音频数据集
语种
yue-Guangdong,粤语(中国广东)
语音类型
朗读式独白
内容
命令控制、数字串
音频参数
16 kHz,16 bits,双通道
文件格式
WAV (PCM)
TXT (UTF-8)
录音设备
麦克风
录音环境
车载
授权方式
Magic Data
open-source license
开源数据集
ASR数据集
5小时
ASR-SCCantCabSC: A Scripted Chinese Cantonese (Canton) Cabin Speech Corpus
This work is licensed under a
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License
.
总时长为5小时的车载环境广式粤语朗读语音音频和转写文本
此数据集包含了5个小时的广式粤语朗读音频和转写文本,内容为车载环境中的数字串与命令控制,包含6,219条由10名说话人提供的语料。
样本:
" 世纪大道塞唔塞车啊 "
概览
数据集类型
ASR音频数据集
语种
yue-Guangdong,粤语(中国广东)
语音类型
朗读式独白
内容
命令控制、数字串
音频参数
16 kHz,16 bits,双通道
文件格式
WAV (PCM)
TXT (UTF-8)
录音设备
麦克风
录音环境
车载
授权方式
Magic Data
open-source license
< Back
Sign in to download
{{ reviewsTotal }}
{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}
评论
写评论
*访客无法进行评论
Verifying Email
Verify Email