Total Size: 282M

概览

数据集类型

ASR数据集

语种

英语

语音类型

N/A

内容

N/A

音频参数

16 kHz, 16 bits

文件格式

WAV (PCM)

录音设备

手机

录音环境

手机

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

开源数据集

ASR数据集

5小时

Multi-stream Spontaneous Conversation Training Datasets_English

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

The Multi-stream conversation dataset developed by MagicData captures each speaker's audio track and labels each speaker separately, thereby preserving the natural occurrences of interruptions, interactions, and other dynamics in conversation. By isolating each speaker's audio, we can provide clearer and more accurate training data, enabling models to more effectively understand and respond to natural conversational exchanges. To facilitate broader understanding and accessibility, we have released a 5-hour sample as part of our open-source initiative: "Multi-stream Spontaneous Conversation Training Datasets_English".

For more commercial datasets, please contact business@magicdatatech.com.

概览

数据集类型

ASR数据集

语种

英语

语音类型

N/A

内容

N/A

音频参数

16 kHz, 16 bits

文件格式

WAV (PCM)

录音设备

手机

录音环境

手机

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

备案号: 京ICP备18008050号-6号

京公网安备 11010802035822号

Your IP is: 216.73.216.124

SIGN IN

注册

Total Size: 282M

概览

数据集类型

语种

语音类型

内容

音频参数

文件格式

录音设备

录音环境

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

Multi-stream Spontaneous Conversation Training Datasets_English

概览

数据集类型

语种

语音类型

内容

音频参数

文件格式

录音设备

录音环境

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

京公网安备 11010802035822号

SIGN IN

注册

Total Size: 282M

概览

数据集类型

语种

语音类型

内容

音频参数

文件格式

录音设备

录音环境

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

Multi-stream Spontaneous Conversation Training Datasets_English

概览

数据集类型

语种

语音类型

内容

音频参数

文件格式

录音设备

录音环境

授权方式

MAGIC DATA OPEN-SOURCE LICENSE

京公网安备 11010802035822号

Verifying Email