概览

数据集类型

语音识别(ASR)音频数据集

语种

cmn-Tianjin

语音类型

对话式

内容

自由对话

音频参数

16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内

热门数据集

开源数据集
3.1 hours
ASR数据集
291 MB
开源数据集
5小时
ASR数据集
1.13 GB
爱数智慧自有数据集
703小时
ASR数据集
开源数据集
4.8 hours
ASR数据集
420 MB
第三方
ASR数据集
15GB
爱数智慧自有数据集
ASR数据集
973小时

天津话对话音频数据集

MDT-ASR-F054 | 总时长为973小时的天津话对话音频和转写文本

概览

数据集类型

语音识别(ASR)音频数据集

语种

cmn-Tianjin

语音类型

对话式

内容

自由对话
16 kHz, 16 bits, 单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机

录音环境

室内

授权方式

此数据集合包含973个小时的天津话对话音频和转写文本,内容为由518名说话人提供的自由对话语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

评论

{{ reviewsTotal }} Review
{{ reviewsTotal }} Reviews
写评论
*访客无法进行评论