文件大小：694 MB

概览

数据集类型

语音识别（ASR）音频数据集

语种

zh-CN，中文普通话（中国）

语音类型

朗读式独白

内容

朗读式唤醒词

音频参数

48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

室内

授权方式

Magic Data
open-source license

开源数据集

ASR数据集

3.23小时

ASR-SCKwsptSC: A Scripted Chinese Keyword Spotting Speech Corpus

Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

总时长为3.23小时的中文普通话朗读数据集和转写文本，有快—中—慢三种语速

此开源数据集包含3.23小时的中文普通话朗读音频和转写文本，内容为快中慢三种语速下朗读的唤醒词，有4,546条有102名说话人朗读的语料。

样本：

语速：中

语速：快

语速：慢

概览

数据集类型

语音识别（ASR）音频数据集

语种

zh-CN，中文普通话（中国）

语音类型

朗读式独白

内容

朗读式唤醒词

音频参数

48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF-8)

录音设备

麦克风

录音环境

室内

授权方式

Magic Data
open-source license

©Copyright 2017- 2025 by Magic Data Technology (北京晴数智慧科技有限公司). All Rights Reserved.

备案号: 京ICP备18008050号-6号

京公网安备 11010802035822号

Your IP is: 216.73.216.172