DiaKG:用于构建医学知识图谱的糖尿病标注数据集【命名实体识别(NER)和关系抽取(RE)】_疾病语料ner任务-CSDN博客

网站介绍:文章浏览阅读1.7k次。知识图谱在结构化信息和概念性知识的建模方面已经被证明是有效的,特别是在医学领域。然而,缺乏高质量的标注语料库仍然是推进这一任务的研究和应用的关键问题。为了加快医学领域特定知识图谱的研究,我们介绍了DiaKG,一个高质量的糖尿病知识图谱的中文数据集,它包含了22,050个实体和6,890个关系。我们实施了最近的典型的命名实体识别和关系抽取方法作为基准来全面评估所提出的数据集。实证结果表明,DiaKG对大多数现有的方法来说是具有挑战性的,并进行了进一步的分析,以讨论未来的改进研究方向。我们希望这个数据集的发布能_疾病语料ner任务