MagicData
SIGN IN

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN

语音类型

对话式

内容

自由对话

音频参数

16 kHz, 16 bits, 单通道
8 kHz,16 bits,单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机、电话

录音环境

室内
Magic Data自有数据集
ASR数据集
5873小时

ASR-BigCCSC: A Chinese Conversational Speech Corpus

MDT-ASR-E037 | MDT-ASR-E043 | MDT-ASR-E056 | MDT-ASR-F002
总时长为5,873小时的中文普通话自由对话音频和转写文本

此数据集集合包含5,873小时的中文普通话朗读音频和转写文本,内容为由10,436名说话人提供的自由对话语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN

语音类型

对话式

内容

自由对话

音频参数

16 kHz, 16 bits, 单通道
8 kHz,16 bits,单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机、电话

录音环境

室内

授权方式

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email