代码拉取完成,页面将自动刷新
同步操作将从 luge-ai/luge-ai 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
数据集简介:
LCSTS(Large-scale Chinese Short Text Summarization)数据集从新浪微博自动采集,以原作者撰写的微博全文作为输入,微博头部中括号内的概括句作为输出,提供了目前为止规模最大的中文摘要数据集。在240余万自动标注数据中,人工精标注了1万余数据的质量得分。LCSTS数据集在后续的(中文)短摘要算法研究中被广泛采用。
数据集详情:
名称 | 规模 | 创建日期 | 作者 | 单位 | 论文 | 下载 | 评测 |
---|---|---|---|---|---|---|---|
LCSTS | 240万短摘要数据 | 2015-08 | 户保田 等 | 哈尔滨工业大学(深圳)智能计算研究中心 | 链接 | 链接 | N/A |
基于该数据集发表的相关论文:
数据集简介:
NLPCC(国际自然语言处理与中文计算会议)是由中国计算机学会中文信息技术专业委员会主办的年度学术会议,自2012年起每年举办一次。NLPCC2017的一个评测任务(Task3)是单文档摘要任务,包含5万条经过标注的新闻数据,标注的结果是不多于60字的短摘要。
数据集详情:
名称 | 规模 | 创建日期 | 作者 | 单位 | 论文 | 下载 | 评测 |
---|---|---|---|---|---|---|---|
NLPCC2017 | 5万短摘要数据 | 2017-08 | N/A | N/A | N/A | 链接 | 链接 |
基于该数据集发表的相关论文:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。