MagicData
SIGN IN

概览

数据集类型

自然语言理解(NLP)文本语料

语种

zh-CN

语音类型

N/A

内容

聊天

音频参数

N/A

文件格式

TXT (UTF8)

录音设备

N/A

录音环境

N/A
Magic Data自有数据集
NLP语料库
2,095,686句

NLP-CCC: A Chinese Chitchat Corpus

MDT-NLP-F016 | 2,095,686句中文聊天语料

此数据集包含2,095,686条中文聊天语料。

联系 business@magicdatatech.com 获取更多详情。

样本:

咱今天唠点儿啥呀芬芬 休闲娱乐
哎你知道钻石叫啥不 休闲娱乐
也是世界文明的一个旅游景点 衣食住行
都江堰啊青城山这些就比较适合夏天去 衣食住行
文苑是你们学校吗? 人际关系
那天那天天还能一块吃饭呢? 人际关系
他就不畏艰险哦,不不是鉴真,是中国人好像鉴真是中国人 人文科学
就郑和下西洋对 人文科学

概览

数据集类型

自然语言理解(NLP)文本语料

语种

zh-CN

语音类型

N/A

内容

聊天

音频参数

N/A

文件格式

TXT (UTF8)

录音设备

N/A

录音环境

N/A

授权方式

{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}评论
写评论
*访客无法进行评论

Verifying Email