登录 后进行下载

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

日常用语,
命令控制
短信
16 kHz,16 bits,单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机(主要)

录音环境

室内

类别

ASR Corpus

中文普通话朗读音频数据集-日常用语/命令控制/短信

总时长为755小时的中文普通话朗读语音音频和转写文本,语料内容为日常用语、命令控制和短信

概览

数据集类型

语音识别(ASR)音频数据集

语种

zh-CN,中文普通话(中国)

语音类型

朗读式独白

内容

日常用语,
命令控制
短信
16 kHz,16 bits,单通道

文件格式

WAV (PCM)
TXT (UTF8)

录音设备

手机(主要)

录音环境

室内

此数据集包含了755个小时的中文普通话朗读音频和转写文本,由1080名说话人提供。

样本:

“提醒他明天早上差五分九点聚会”

此数据集最先在OpenSLR发布。 访问http://openslr.org/68/ to download下载。

该数据集是以“现状”为基础提供的,并不提供任何明示或暗示的保证。 您将独自承担使用该数据集的风险。 您明确理解并同意,MagicHub和/或北京爱数智慧科技有限公司不承担任何直接、间接、偶然、特殊或间接的损害赔偿责任,包括但不限于利润损失、商誉损失、使用损失、数据损失或其他与该数据集有关的无形损失赔偿责任。

Copyright © 2021 北京爱数智慧科技有限公司 版权所有

我们还有更多同类可用数据集。如果您有任何问题或数据需求,请随时与联系我们

评论

{{ reviewsTotal }} Review
{{ reviewsTotal }} Reviews
{{ options.labels.newReviewButton }}
*访客无法进行评论