(paper reading)Entity Linking with a Knowledge Base: Issues, Techniques, and Solutions

给定一个包含一系列实体E的知识库,以及提到了M个已确定实体的文本集合,实体链接的目的是将文本中提到的每个实体m∈M链接到知识库中对应的实体e∈E上。如果文本中提到的实体在知识库中没有对应,则被称为unlinkable mentions,对这样的一类实体,一个实体链接系统会给它加上一个特殊的标签NIL。


  • Candidate entity generation


    • dictionary based techniques


    • surface form expanssion from the local document


      • Heuristic Based Methods
      • Supervised Learning Methods
    • methods based on search engine 


  • Candidate entity ranking


  确定准则需要了解实体的features,context-independant features包括name string comparison,entity popularity和entity type,即只需要考虑实体本身和候选的实体集合本身,context-dependant features则需要分析实体出现的环境,包括textual context和coherence between mapping entities。


    • supervised ranking methods

      • binary classification methods
      • learning to rank methods
      • probabilistic methods
      • graph based approaches
      • model combination
      • training data generation
    • unsupervised ranking methods
      • VSM based methods
      • information retieval based methods
  • Unlinkable mention prediction

  确认排序最靠前的候选实体是否是m对应的目标实体,如果都不是需要给m加上unlikable mention的标签。


  • Information Extraction
  • Information Retrieval
  • Content Analysis
  • Question Answering
  • Knowledge Base Population


1. 考虑对其他类型的mention进行链接,而不是文本中的。

2. 考虑计算复杂度,效率和可扩展性。

3. 考虑domain-specific entity linking system。

时间: 2024-08-25 02:12:54

