INTERSPEECH 2020喊你开赛!口音英语语音识别技术挑战赛正式启动!

语音技术圈顶会之一INTERSPEECH 2020,以“Cognitive Intelligence for Speech Processing”为主题,即将登陆上海。

2020口音英语语音识别技术研讨会暨挑战赛(以下简称2020AESRC)作为本年度INTERSPEECH的旗舰技术活动,计划于2020年10月25日在中国上海同步举行。



竞赛背景

英语作为最具影响力的全球性交流语言之一,与其相关的英语语音识别系统也在学术界和工业界受到广泛关注。

当前阶段,标准英语ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是口音英语识别仍然是具有挑战性的课题,商用系统往往通过大量的口音标注数据覆盖来缓解口音带来的识别性能影响。

口音语音识别面临着口音本身的不一致性、语速与音素发音的多变性带来的建模难题。另外,带有口音标注的语音数据的短缺也严重限制了相关研究的开展。

Interspeech 2020口音英语语音识别挑战赛 (Interspeech2020 Accented English Speech Recognition, AESR) 向参赛者开放了来自不同国家的共八种口音英语数据,覆盖了各种发音特点、口音轻重,旨在加强英语语种识别、口音语音识别的研究交流。期待来自学术界与工业界的学术研究者能够相互切磋,有所收获。

赛道介绍

赛道1:口音种类识别

使用官方提供的各种口音英语的训练数据,训练语种分类模型。提交测试集合上的语种识别结果。

赛道2:口音英语语音识别


使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。测试集合中会出现训练集外的口音以验证模型泛化性能。

指定数据

数据堂向参赛者提供8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国、中国)的口音英语数据,每个国家20小时,总量160小时。

时长

每种口音约20小时,共8种口音

语言与口音类型

来自俄罗斯、韩国、美国、葡萄牙、日本、印度、英国与中国的带口音的英语

音频格式

16kHz, 16bit, 单声道wav

录音环境

相对安静的室内,手机录音

音频内容

日常交流为主,包含人机交互等场景

训练数据将与按如下格式组织的metadata同时开放。

字段描述

SEX:说话人性别

AGE:说话人年龄

ACT:口音类别

MIT:录音设备

SCC:录音环境

LBR:音频时长

ORS:对应抄本

两个赛道中允许使用Librispeech数据 openslr.org/12/

奖项设置

赛道一

一等奖 10000元 1名

二等奖 5000元 2名

三等奖 2000元 3名

赛道二

一等奖 10000元 1名

二等奖 5000元 2名

三等奖 2000元 3名

参赛日程

2020年8月20日 参赛报名截止2020年8月21日 组委会提供训练数据2020年9月22日 组委会提供测试集2020年9月24日 参赛团队提交测试结果2020年9月30日 组委会公布评测结果2020年10月9日 参赛团队提交方案介绍2020年10月25日 获奖团队颁奖

竞赛指导委员会

谢磊 教授 西北工业大学

钱彦旻副 教授 上海交通大学

Shinji Watanabe 副教授 美国约翰霍普金斯大学

Chng Eng Siong 副教授 新加坡南洋理工大学

丰强泽 CTO 数据堂(北京)科技股份有限公司

联合主办单位

中国计算机协会语音对话与听觉专业组西北工业大学音频语音与语言处理研究组上海交通大学智能语音实验室新加坡南洋理工大学计算机科学与工程学院美国约翰霍普金斯大学语言与语音处理中心西安高新产业技术开发区软件园发展中心陕西鲲鹏生态创新中心数据堂(北京)科技股份有限公司

大赛面向语音技术爱好者,高等院校、科研单位、企业、创客团队等人员均可报名参赛,每位选手只能加入1支队伍。

报名方式

登录官网竞赛界面:
datatang.com/INTERSPEEC(或直接点击“阅读原文”),下载并填写报名表。

将填写完毕的报名表发送到指定邮箱interspeech2020@datatang.com,邮件主题命名为【口音英语竞赛-队伍名称】。

扫描下方二维码加入大赛微信交流群,入群请备注:姓名-公司/学校-参与赛题名。

weixin.qq.com/g/AQYAAIt (二维码自动识别)




关于数据堂

数据堂(北京)科技股份有限公司成立于2011年9月(股票代码:831428),是专业的人工智能数据服务提供商,致力于为全球人工智能企业提供数据获取及数据产品服务。

依托自身的数据资源、技术优势及丰富的数据处理经验,数据堂为国内外1000多家人工智能企业和科研机构提供了优质的数据服务。数据堂于2014年完成新三板挂牌,成为中国人工智能数据服务行业第一家上市企业。

数据堂官网:datatang.com

数据咨询热线:400-650-6137

weixin.qq.com/r/TUiAmB- (二维码自动识别)

发布于 08-04