各相关单位: 2019第二届中国“AI+”创新创业大赛--自然言语处置技术创新大赛(以下简称“大赛”)将于2019年5月至11月举行。 自然言语处置作为人工智能技术中重要的一个研讨范畴,近年来得到了快速展开,新模型和新措施层出不穷。为了促进中文自然言语技术的展开,中国人工智能学会特此主办本次自然言语处置技术大赛。为从事中文自然言语处置研讨的研讨人员、产业界从业人员以及AI技术喜好者提供一个良好的沟通平台。 现将2019第二届中国“AI+”创新创业大赛--自然言语处置技术创新大赛的有关事项通知如下: 一、大赛机构 1.主办单位 2.组织单位 科大讯飞股份有限公司 3. 承办单位 认知智能国度重点实验室(科大讯飞) 哈尔滨工业大学社会计算与信息检索研讨中心 苏州大学先进数据剖析研讨中心 4. 评测委员会 主 席: 陈志刚(认知智能国度重点实验室) 副主席: 车万翔(哈尔滨工业大学社会计算与信息检索研讨中心) 刘铭(哈尔滨工业大学社会计算与信息检索研讨中心) 李直旭(苏州大学先进数据剖析研讨中心) 二、参赛措施 1.参赛对象 本次大赛是面向全国高校,科研机构,和触及自然言语处置、数据发掘、学问图谱等技术的人工智能范畴企业的赛事,欢送各单位积极组织队伍申报参赛。 2.参赛组队方式 选手可在网上自行组队报名,每支队伍包含 3-5 名队员,选手的地域、年龄、职业不限,每队至少有一名中国国籍选手。 以公司为单位参赛,需已注册成立企业;高校以团队为单位参赛,需由指导教员带领。参赛个人及单位请求无不良记载;参赛项目的产品、技术及相关专利专属于参赛团队及个人,与其他任何单位或个人无产权纠葛,如在参赛期间发现有侵犯外单位学问产权或盗用成果等纠葛,一经核实,立刻终止该参赛队参赛资历,取消其已取得的奖项。 3. 报名方式 2019年6月30日前,参赛队伍在大赛网站(https://aichina.caai.cn/)的报名系统中在线报名,完成相关信息录入,完成报名。(有特殊请求的各赛区自行肯定后能够向大赛组委会提出需求) 4. 参赛选题 (1)竞赛背景 近年来深度学习在语音、图像、自然言语处置等人工智能任务中均取得令人注目的突破,而实践的自然言语处置任务大多是复杂综合性任务,学问问答作为自然言语范畴一个重要的子范畴,吸收了众多研讨者的关注,经过在结构化或者非结构化的文本数据中寻觅问题答案,属于综合性的自然言语处置研讨子方向,比较全面表示了自然言语处置的技术水平。本赛题选择历史学问问答,是为了调查自然言语处置多项技术的综合运用才干,从试题的语义了解、外部学问的综合运用两个方面调查机器的认知智能才干。 (2)赛题描画 本次赛题是基于中文历史学问图谱以及对应实体相关的百科页面内容,完成中文历史学问问答系统。即给定一个中文历史学问类问题,问答系统从给定的学问库和实体相关的百科页面内容当选择若干信息作为该问题的答案。细致的题型为填空题。 输入:输入文件包含若干行填空题题干,每行一个题目。 输出:输出文件每行对应一个填空题的答案列表,多个答案运用t分隔,文件编码采用utf8编码。 题目示例: 1)我国历史上独一的女皇帝______ 2)唐朝进入全胜时期,史称“开元盛世”的皇帝______ 3)结果南北朝的团结局面,树立隋朝的皇帝______ 4)世界上最早的纸币______ 答案示例: 1)武则天 2)李隆基 3)杨坚 4)交子 特别阐明: 当问题所触及的事实与学问库不分歧时,以学问库中数据为准。 当问题从所提供的学问图谱和百科文档中都能够找到多个答案时,命中任何一个答案均可。好比问题:唐朝进入全胜时期,史称“开元盛世”的皇帝,回答“唐玄宗”或“李隆基”都对。 (3)模型锻炼 主办方提供如下解题思绪供参赛选手参考,选手可依照如下思绪开发历史学问问答模型,也可选择其他人工智能措施,思绪不限。 参考解题思绪: 步骤一:构建基于学问图谱的问答系统 步骤二:构建基于实体非结构化学问文档的问答系统 步骤三:以一定融合战略融合两个模型的结果 (4)锻炼集数据引见 主办方发布两种资源: 1)历史学问图谱,大致范围为:实体约64万、三元组约467万,每个实体相关的百科页面。 2)历史学问问答题目(题型为填空)共2000题,作为示例开发集。 5.作品请求 参赛队的参赛内容应该是参赛队员独立设计、开发完成的作品,严禁剽窃、剽窃等行为。凡发现剽窃、剽窃等行为,将取消参赛队伍的参赛资历,并清查相关指导教员和单位的义务。 三、竞赛时间布置 2019年5月10日:发布大赛通知,开端报名 2019年5月20日:发布竞赛锻炼集数据和细致评测计划 2019年6月30日:报名截止 2019年8月31日:提交测试集结果截止日 2019年9月5日:提交最终测试结果对应的系统代码及系统讲演 2019年9月25日:决赛名单发布 2019年10月下旬或11月上旬:决赛和颁奖 四、竞赛赛制 1.竞赛整体流程 (1)初赛:参赛队需于2019年6月30日前完成报名,并在数据发布之后从网站获取主办方发布的竞赛用历史学问图谱和相应实体页面资源、示例开发集。之后即可开端数据处置与问答系统构建,2019年6月20日起能够online提交各自开发系统的网络ip地址参与测试结果评测排名,2019年8月31日为最后系统提交更新日。2019年9月5日前,各参赛队需求提交系统源码,和引见所提交模型、措施和架构方面的系统讲演。 (2)决赛:决赛将于2019年10月下旬或11月上旬组织,细致方式初定为由升级队伍中止ppt讲演,由专家评议给出打分,再分离初赛得分给出最终名次。决赛的细致时间和方式将另行通知。 2.初赛评测规则 主办方将对参赛队伍产生的测试结果与竞赛主办方发布的规范结果中止相似性评价,最终得到各参赛队伍初赛作品的精确度(Accuracy)。思索到基于文档的问答可能会给出近似但不完整匹配的答案,我们将采用含糊匹配的措施来判定结果的正确性,满足指定相似度阈值的答案将被判定为正确答案。 参赛队伍请自行运用官网上的测评程序对锻炼数据集的编译结果中止评价,如参赛队伍产生的分类结果文件未能与官网上的评价程序相兼容,则需自行对结果格式中止调整和修正。 竞赛主办方评选获奖者的主要依据: 1) 参赛作品在测试数据集上抵达的精确度值; 2) 锻炼过程成运用模型的新颖水平和创新性。 3.参赛规则引见 1)允许运用开源代码、工具和公开数据集,计轿赛队伍自己以往开发未公开的代码和数据集。 2) 经组委会评价后确认获决赛资历;如拒绝或未在规则时间内提供相应代码和文档则取消决赛资历。 五、奖项设置 本赛事预选8队进入决赛,最终角逐出冠军1队、亚军2队、季军3队,对应奖励如下: 冠军赛队(1队)奖金15000元人民币/队; 亚军赛队(2队)奖金10000元人民币/队; 季军赛队(3队)奖金 5000元人民币/队。 六、竞赛管理 1.参赛费用 本次参赛不收取任何费用。 2.餐饮住宿 参与决赛队伍的教员和学生在决赛期间的食宿费用、交通费用及其他费用均自理。 3.竞赛秘书处联络方式 报名网站:https://aichina.caai.cn/ 报名、赛务等联络人:牛雷 邮箱:2690553789@qq.com 电话:15051540646 2019第二届中国“AI+”创新创业大赛 --自然言语处置技术创新大赛 中国人工智能学会 2019年5月10日 |