车载多通道语音识别挑战赛(ICMC-ASR)丨ICASSP2024

2023-09-13 11:11:52

希尔贝壳理想汽车西工大音频语音与语言处理研究组新加坡南洋理工大学天津大学WeNet开源社区微软中国信通院等单位发起的“车载多通道语音识别挑战赛(ICMC-ASR)将作为IEEE声学、语音与信号处理国际会议(ICASSP2024)的旗舰赛事,正式启动。报名参加此次赛事,您将获得:

  • 业界首个新能源车智能座舱多通道实录语音数据集;

  • 超百人的车内驾驶员和乘客间语音对话数据,覆盖不同驾驶场景;

  • 测试车载语音识别的真实技术水平;

  • 顶会 ICASSP2024 受邀论文和报告机会;

  • 与国际语音学术和产业界深度交流技术前沿的机会。

  官网:https://icmcasr.org

背景

随着汽车成为人们日常生活中不可或缺的一部分,而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力,存在安全风险,因此,车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同,驾驶场景中的系统面临更加独特的挑战,缺乏大规模的公共真实车内数据一直是该领域发展的主要障碍。因此,特推出车载多通道语音识别挑战赛(ICMC-ASR)

本次赛事发布一个真实的车内多通道语音语料库,包含约 1000小时、车内真实录制的多通道普通话语音数据,收音设备包含车内分布式麦克风收集的远场数据,以及参与者的头戴麦克风收集的近场数据。更多赛事数据的详细信息请参考官方网站的数据介绍。

数据集样例:

demo1

demo2

赛 道

ICMC-ASR 设立了两个不同的赛道:

• Track I Automatic Speech Recognition (ASR): 

提供评估集的真实的说话人日志结果。任务目标是开发基于多通道多说话人语音识别系统。参与者需要关注不同通道数据信息融合、背景噪声抑制以及多说话人重叠等。

•  Track II Automatic Speech Diarization and Recognition (ASDR): 

去除说话人日志的先验知识(如说话人的分割、说话人标签以及说话人人数),参与者需要使用说话人日志和识别技术对评估集中的每个会话进行分割和转录。该任务接受端到端系统以及允许更多的系统灵活性。

有任何问题,可联系:icmcasr_challenge@aishelldata.com 。

重要日期

9.12

注册开放

9.30

训练集发布,注册截止

10.7

验证集和基线系统发布

12.5

测试集发布,榜单开启

12.19

最终结果提交截止

12.30

系统说明提交截止

注册

ICMC-ASR 赛事对高校、公司和科研机构开放,并邀请排名靠前的队伍基于竞赛系统形成论文,在 ICASSP2024 上发表。参赛者在9月30日前可登录赛事官网 (https://icmcasr.org) 进行注册,请按照以下要求注册挑战赛:

  1. 机构或者公司邮箱注册,个人邮箱如 163.com、qq.com等不可;

  2. 提供团队名称、隶属机构、参与赛道信息。

主办方将在3个工作日内通过电子邮件通知符合条件的参赛团队,团队必须遵守赛事官网上发布的挑战规则。本次赛事最终解释权归组委会。

组织者 

  • Lei Xie, Northwestern Polytechnical University
  • Eng Siong Chng, Nanyang Technological University
  • Zhuo Chen, Microsoft Corporation
  • Jian Wu, Microsoft Corporation
  • Longbiao Wang, Tianjin University
  • Hui Bu, AIShell Inc and AIShell Foundation

  • Xin Xu, AIShell Inc
  • Binbin Zhang, WeNet Open Source Community 
  • Wei Chen,  Li Auto

  • Pan Zhou, Li Auto

  • He Wang, Northwestern Polytechnical University

  • Pengcheng Guo, Northwestern Polytechnical University

  • Sun Li, China Academy of Information and Communication Technology

图片

更多推荐

领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计

Golang goroutine MPG模式浅析

协程是通过使用关键字go调用(或执行)一个函数或者方法来实现的(也可以是匿名函数)。Go语言在语言层面上支持了并发,goroutine是Go语言提供的一种用户态线程,有时我们也称之为协程。所谓的协程,某种程度上也可以叫做轻量线程,它不由os而由应用程序创建和管理,因此使用开销较低(一般为4K)。我们可以创建很多的gor

【无公网IP内网穿透】Windows搭建Web站点

什么是cpolar?cpolar是一个非常强大的内网穿透工具,开发调试的必备利器。它可以将本地内网服务器的HTTP、HTTPS、TCP协议端口映射为公网地址端口,使得公网用户可以轻松访问您的内网服务器,无需部署至公网服务器。支持永久免费使用,无需公网IP,也无需设置路由器。概述本次教程中,我们将实现在windows上搭

第十九章、【Linux】开机流程、模块管理与Loader

19.1.1开机流程一览以个人计算机架设的Linux主机为例,当你按下电源按键后计算机硬件会主动的读取BIOS或UEFIBIOS来载入硬件信息及进行硬件系统的自我测试,之后系统会主动的去读取第一个可开机的设备(由BIOS设置的),此时就可以读入开机管理程序了。开机管理程序可以指定使用哪个核心文件来开机,并实际载入核心到

【Java系列】深入解析 Lambda表达式

序言你只管努力,其他交给时间,时间会证明一切。文章标记颜色说明:黄色:重要标题红色:用来标记结论绿色:用来标记一级论点蓝色:用来标记二级论点希望这篇文章能让你不仅有一定的收获,而且可以愉快的学习,如果有什么建议,都可以留言和我交流1基础介绍1.1概念介绍JavaLambda表达式是Java8中最重要的新特性之一。它们是

MySQL常见面试题(三)

😀前言在当今数据驱动的时代,数据库管理成为企业和组织的核心组件。其中,数据库的性能优化是确保信息可以快速、准确地检索的关键要素。这通常通过正确实现和管理数据库索引来实现。索引不仅可以大大提高数据库的查询性能,还可以帮助维持数据的完整性和一致性。本文将深入探讨MySQL数据库中的不同类型的索引,包括其特点和实现方式。我

《计算机视觉中的多视图几何》笔记(6)

前面的1-5章在序号上被标为Part0,标题是TheBackground:ProjectiveGeometry,TransformationsandEstimation,讲述了一些背景知识,包括投影几何、变换和估计。接下来的部分进入到Part1,标题是CameraGeometryandSingleViewGeometr

CDN内容分发系统

CDN分发系统的架构。CDN系统的缓存,也是一层一层的,能不访问后端真正的源,就不打扰它。在没有CDN的情况下,用户向浏览器输入www.web.com这个域名,客户端访问本地DNS服务器的时候,如果本地DNS服务器有缓存,则返回网站的地址;如果没有,递归查询到网站的权威DNS服务器,这个权威DNS服务器是负责web.c

JavaScript Iterator 迭代器:简化集合遍历的利器

🎬岸边的风:个人主页🔥个人专栏:《VUE》《javaScript》⛺️生活的理想,就是为了理想的生活!目录引言1.迭代器的概念2.迭代器的属性3.迭代器的应用场景3.1数组遍历3.2对象遍历3.3Map遍历#3.4Set遍历4.自定义迭代器结论引言在JavaScript中,迭代器(Iterator)是一种用于遍历集

数据结构——图(图的基本概念)

文章目录前言一、图的基本概念图的定义总结前言图的基本概念1.1有向图1.2无向图1.3有向完全图1.4无向完全图1.5连通图一、图的基本概念图的定义图的定义:图G是顶点集V和边集E组成,记为G=(V,E),其中V(G)表示图G中顶点有限非空集,E(G)表示图G中顶点之间关系(边)的集合,图中顶点个数也叫图的阶,图不可以

解决 MyBatis-Plus + PostgreSQL 中的 org.postgresql.util.PSQLException 异常

🌷🍁博主猫头虎带您GotoNewWorld.✨🍁🦄博客首页——猫头虎的博客🎐🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺🌊《IDEA开发秘籍专栏》学会IDEA常用操作,工作效率翻倍~💐🌊《100天精通Golang(基础入门篇)》学会Golang语言,畅玩云原生,走遍大

热文推荐