同步操作将从 luge-ai/luge-ai 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
数据集简介:
DuEE是由百度构建的目前业界规模最大的中文事件抽取数据集,其任务目标是通过给定目标事件类型和角色类型集合及句子,识别句子中所有目标事件类型的事件,并根据论元角色集合抽取事件所对应的论元。
数据集详情:
名称 | 规模 | 文本来源 | 评测 | 下载 | 论文 |
---|---|---|---|---|---|
DuEE | 65种事件类型、1.7万句子,2万事件 | 新闻 | LIC2020 | 链接 | - |
数据集简介:
ACE 2005 Multilingual Training Corpus是2005年自动内容提取(Automatic content extraction, ACE)技术评测中所使用的数据。数据包含英文、中文、阿拉伯文3种语言,文中的实体、数值、时间、关系、事件5种数据均被标注,是事件抽取研究中最常用的数据集之一。其中的中文部分包括633篇文档,8种事件类型,33种子事件类型,2521个事件。
数据集详情:
名称 | 文本来源 | 规模 | 评测 | 下载 | 论文 |
---|---|---|---|---|---|
ACE 2005 | 新闻,博客等 | 中文部分包括633篇文档,2521个事件 | ACE 2005 | 链接 | 链接 |
基于该数据集发表的相关论文:
数据集简介:
TAC KBP Event Track是TAC会议知识库方向(Knowledge Base Population, KBP)的一个关注事件抽取的子方向,其目标是抽取事件的结构化信息,使之能够成为知识库构建的一种合适输入。其中的事件论元抽取任务(Argument Task)的目标则是抽取事件中的论元及其在事件中扮演的角色。 该任务总共举办了4次,其中,2014-2015年的数据集仅包含英语,2016-2017年则包含英语、中文、西班牙语3种语言。
数据集详情:
名称 | 文本来源 | 规模 | 评测 | 下载 | 论文 |
---|---|---|---|---|---|
TAC KBP Event Track 2016 | 论坛 & 新闻网页 | 18类事件类型, 500篇文档 | TAC2016 | 仅对参赛者提供 | 链接 |
TAC KBP Event Track 2017 | 论坛 & 新闻网页 | 18类事件类型, 500篇文档 | TAC2017 | 仅对参赛者提供 | 链接 |
基于该数据集发表的相关论文:
数据集简介:
中文突发事件语料库是由上海大学(语义智能实验室)所构建。根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,合计332篇文档。
数据集详情:
名称 | 文本来源 | 规模 | 评测 | 下载 | 论文 |
---|---|---|---|---|---|
中文突发事件语料库 | 新闻 | 5类突发事件, 332篇文档 | - | 链接 | 链接 |
基于该数据集发表的相关论文:
数据集简介:
面向金融领域的事件主体抽取是CCKS 2019发布的一份评测数据集,其中包含金融事件短句及其金融主体数据约2万条。数据均来自互联网新闻, 事件类型包括: 产品出现问题、高管减持、违法违规等。
数据集详情:
名称 | 文本来源 | 规模 | 评测 | 下载 | 论文 |
---|---|---|---|---|---|
CCKS 2019 面向金融领域的事件主体抽取 | 新闻 | 近2万个事件 | 链接 | 链接 | - |
基于该数据集发表的相关论文:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。