MagicData

sign in

Total Size: 92KB

Dataset Overview

Dataset Type

Text corpus for NLP

Language

CN&JP

Speech Style

N/A

Content

goods information in e-commerce

Audio Parameters

N/A

File Format

.xlsx

Recording Equipment

N/A

Recording Environment

N/A
Open Source
NLP Corpus
1000 sentences

NLP_Chinese-Japanese Parallel Corpus - E-Commerce

MH-NLP-012

Here we present a Chinese-Japanese Parallel E-Commerce Corpus.

The dataset consists of 1000 sentences of headlines, specifications, comments of goods and products, as well as Q&A information collected from an e-commerce platform. Categories of the products include electronic devices, clothes, children toys, hair products and cosmetics, etc. The corpus is based on Chinese language. Then it was translated into Japanese by professional native Japanese translators and proofread by native Chinese speakers in Japan.

Our recommended application for this dataset would be machine translation for e-commerce.

Sample:

中文(Chinese)字数(Chinese Characters)日文(Japanese)
五个刷子一个没发,一个发错,还不回复,姐妹们慎重!那个斜角的里面有几根粗毛扎死了,根本不能用!47ブラシ5 つ買ったが、1 つ発送されてない、1つ間違ってます。連絡したがいまだに返信がないです。検討中の女性の方々、気をつけた方がいいですよ!内側に太い毛が数本あってチクチクして痛すぎて使い物になりません。
很有设计感的耳环,还以为会很大,质量很好,戴起来很好看 喜欢的姐妹可以冲!!38デザイン抜群のピアス。思ったより小さめで、クォリティも良かったです。付けてみたら想像を上回りました!買って損はないと思います! !
买家服务很好,整体质量做工用料都很不错,这个办公桌款式风格蛮好看的,这次购物体验蛮不错43サービスがとても良かったです。全体の仕上がりも素材もかなりいいです。このオフィスデスクっぽい感じもよくて、いい買い物でした。
香水到货后需要静置2-4天再试香,静置是因为物流过程摇晃,会导致香水里酒精成分不稳定。43香水が届いたら、香りを試す前に2〜4日放置したほうがいいです。なぜなら、配達中の揺れによって香水の中に含まれるアルコール成分が不安定になった可能性があるからです。
外套码数标准,试穿一下刚刚好,质感非常好,做工精致走线整齐。颜色和图片相符。38コートを着てみたら、サイズちょうどよかったです。質感も良くて、仕上がりも絶妙。色も写真通りでした。
本店都是用动物奶油制作的,动物奶油收到会有些化,是正常现象,可以冷冻1小时口感更好哦~43本店は動物性脂肪を使用しております。動物性クリームが多少溶けてる感じは正常な現象です.1時間冷凍すると味が良くなりますよ〜
皮薄陷调多,软软糯糯的珍珠,外皮还拉丝,推荐!23皮は薄くてくぼみは多く、柔らかくもちもちしたタピオカで、外側はさらにビヨーンと伸びます。超おすすめ!
羽绒服做工精细,穿着暖和,目前也没有发现跑毛,尺码合适27このダウンジャケット、仕上がりも着心地が良くてびっくりしました。今のところ毛羽立ちが見られず、サイズもぴったりです。
跟姐妹聚会用上了这个香槟杯,不仅颜色好看,碰杯的时候声音也很清脆。33親友たちとのパーティーでこのシャンパングラスを使ってみました。思ったより色がよくて、乾杯する時の音もとてもきれいでした。
看中了手工杯杠的颜色,很喜欢,当时去北京SKP的时候就买了,这次再补一只。37手作りのカップの色に一目惚れして買いました。1個目は北京SKPに行ったときに買ったものですが、今回は追加購入。

Dataset Overview

Dataset Type

Text corpus for NLP

Language

CN&JP

Speech Style

N/A

Content

goods information in e-commerce

Audio Parameters

N/A

File Format

.xlsx

Recording Equipment

N/A

Recording Environment

N/A
{{ reviewsTotal }}{{ options.labels.singularReviewCountLabel }}
{{ reviewsTotal }}{{ options.labels.pluralReviewCountLabel }}
{{ options.labels.newReviewButton }}
{{ userData.canReview.message }}

Verifying Email