登录 to Download.

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN, Mandarin Chinese (China)

语音类型

scripted monologue

内容

daily use sentences,
commands and queries,
SMS
16 kHz, 16 bits, mono

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

mobile (mostly)

录音环境

室内

类别

ASR Corpus

中文普通话朗读音频数据集-日常用语/命令控制/短信

总时长为755小时的中文普通话朗读语音音频和转写文本,语料内容为日常用语、命令控制和短信

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN, Mandarin Chinese (China)

语音类型

scripted monologue

内容

daily use sentences,
commands and queries,
SMS
16 kHz, 16 bits, mono

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

mobile (mostly)

录音环境

室内

This open-source dataset consists of 755 hours of transcribed Mandarin Chinese scripted speech contributed by 1,080 speakers.

Sample:

“提醒他明天早上差五分九点聚会”

This dataset is released on OpenSLR. Visit http://openslr.org/68/ to download.

该数据集是以“现状”为基础提供的,并不提供任何明示或暗示的保证。 您将独自承担使用该数据集的风险。 您明确理解并同意,MagicHub和/或北京爱数智慧科技有限公司不承担任何直接、间接、偶然、特殊或间接的损害赔偿责任,包括但不限于利润损失、商誉损失、使用损失、数据损失或其他与该数据集有关的无形损失赔偿责任。

Copyright © 2021 北京爱数智慧科技有限公司 版权所有

我们还有更多同类可用数据集。如果您有任何问题或数据需求,请随时与联系我们

评论

{{ reviewsTotal }} Review
{{ reviewsTotal }} Reviews
{{ options.labels.newReviewButton }}
{{ userData.canReview.message }}