MagicData
SIGN IN

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh & en-CN

语音类型

朗读式

内容

中英混合:日常用语

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内
Magic Data自有数据集
ASR数据集
1650小时

ASR-SCECoMiDuSC: A Scripted Chinese-English Code-Mixing Daily-use Speech Corpus

MDT-ASR-D028 | 总时长为1,650小时的中英混合朗读音频和转写文本,日常用语相关

此数据集包含了1,650个小时的中文普通话-英语朗读音频和转写文本,内容为由2,134名说话人提供的日常用语语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh & en-CN

语音类型

朗读式

内容

中英混合:日常用语

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内

授权方式

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email