中文 NLP(9) -- 实体识别_实体词识别-CSDN博客

网站介绍:文章浏览阅读4.1k次。(1)实体识别识别 人名,地名,组织机构,日期,时间,百分数,货币这七大实体。重点是人名,地名和组织机构的识别。属于未登录词识别的范畴。人名特征:当今仍使用,活跃的中文姓氏大致有1000 多个,前 586 个姓占了 98.5%。其余姓氏不到 1.5%。名字用字分布较姓氏用字分布要平缓,分散。共 3679 个名字用字,词性分布也很广泛,不仅有实词,还有各类虚词。地名特征:较之人名相比,地..._实体词识别