MagicData
SIGN IN

Total Size: 59 GB

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

日常用语,
命令控制
短信

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

手机(主要)

录音环境

室内

授权方式

Magic Data
open-source license

开源数据集
ASR数据集
755 hours

ASR-BigSCDuComSmsSC: A Scripted Chinese Daily-use, Commands & SMS Speech Corpus

总时长为755小时的中文普通话朗读语音音频和转写文本,语料内容为日常用语、命令控制和短信

此数据集包含了755个小时的中文普通话朗读音频和转写文本,由1080名说话人提供。

样本:

"提醒他明天早上差五分九点聚会"

此数据集最先在OpenSLR发布。 访问http://openslr.org/68/ to download下载。

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

日常用语,
命令控制
短信

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

手机(主要)

录音环境

室内

授权方式

Magic Data
open-source license

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email