MagicData
SIGN IN

Total Size: 3.09 GB

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

车载相关情景下的命令控制

音频参数

44.1 kHz, 16 bits, 双通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

车载环境

授权方式

Magic Data
open-source license

开源数据集
ASR数据集
6.13 hours

ASR-SCCabSC: A Scripted Chinese Cabin Speech Corpus

总时长为6.13小时的中文普通话朗读语音音频和转写文本,
语料内容主要为车载场景下的命令控制语句

此数据集包含了6.13个小时的中文普通话朗读音频和转写文本,内容为车载环境中的命令与控制,包含有5,948条由10名说话人提供的语料。

A noteworthy feature is that two microphones were set up while recording—one at the sun visor, another near the speaker's mouth, on a front passenger seat. Synchronous dual voices, consequently, were recorded.

样本:

"去珠江发展中心的最快路线"

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

车载相关情景下的命令控制

音频参数

44.1 kHz, 16 bits, 双通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

车载环境

授权方式

Magic Data
open-source license

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email