MagicData
SIGN IN

文件大小:714MB

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

全领域(车载相关)

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

手机

录音环境

室内

授权方式

Magic Data
open-source license

开源数据集
ASR数据集
8小时

ASR-SCCabSC: A Scripted Chinese Cabin Speech Corpus

总时长为8小时的车载场景全领域中文普通话朗读音频和转写文本

此数据集包含了8小时的中文普通话朗读音频和转写文本,内容为车载环境下的综合语料,包含8,480个由38名说话人提供的句子。

样本:

"我想拨一下马奎新的幺五七开头的号码"

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

全领域(车载相关)

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

手机

录音环境

室内

授权方式

Magic Data
open-source license

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email