MagicData
SIGN IN

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN

语音类型

朗读式

内容

命令控制、唤醒词、短信

音频参数

16 kHz, 16 bits, 单通道
44.1 kHz, 16 bits, 单通道
44.1 kHz, 16 bits, 双通道
48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

麦克风、手机

录音环境

室内、车载、室内近场/远场
Magic Data自有数据集
ASR数据集
5866小时

ASR-BigSCKwsptComSmsSC: A Scripted Chinese Keyword-spotting, Command & SMS Speech Corpus

MDT-ASR-A003 | MDT-ASR-A010 | MDT-ASR-A011 | MDT-ASR-B001 | MDT-ASR-B002 | MDT-ASR-B016 | MDT-ASR-C001 | MDT-ASR-C009 | MDT-ASR-D024 | MDT-ASR-F055 | MDT-ASR-F063
总时长为5,866小时的中文普通话朗读音频和转写文本,关于人机交互、命令控制、唤醒词和短信

此数据集集合包含了5,866个小时的中文普通话朗读音频和转写文本,内容为由18,954名说话人提供的命令控制、唤醒词和短信相关语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN

语音类型

朗读式

内容

命令控制、唤醒词、短信

音频参数

16 kHz, 16 bits, 单通道
44.1 kHz, 16 bits, 单通道
44.1 kHz, 16 bits, 双通道
48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

麦克风、手机

录音环境

室内、车载、室内近场/远场

授权方式

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email