MagicData
SIGN IN

概览

数据集类型

语音识别(ASR)音频数据集

语种

th-TH

语音类型

朗读式

内容

日常用语

音频参数

16 kHz, 16 bits, 单通道
48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

麦克风、手机

录音环境

室内
Magic Data自有数据集
ASR数据集
1016小时

ASR-BigSTiDuSC: A Scripted Thai Daily-use Speech Corpus

MDT-ASR-D022 | MDT-ASR-E023 | 总时长为1,016小时的泰语朗读音频和转写文本

此数据集集合包含1,016个小时的泰语朗读音频和转写文本,内容为由1,520名说话人提供的日常用语语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

概览

数据集类型

语音识别(ASR)音频数据集

语种

th-TH

语音类型

朗读式

内容

日常用语

音频参数

16 kHz, 16 bits, 单通道
48 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

麦克风、手机

录音环境

室内

授权方式

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email