中文 NLP(8) -- 使用 CRF++ 和 BIO 表示法训练模型_crf bio-CSDN博客

网站介绍:文章浏览阅读5.5k次,点赞2次,收藏15次。一般在训练 NLP 模型,比如分词,词性,组块标注等等时,采用 BIO 表示法,说明如下:B — 代表当前词是一个组块的开始I — 代表当前词在一个组块中O — 代表当前词不在任意组块中 。如果要求更精确,可以增加两个符号:E — 代表组块结束S — 代表当前词是一个组块,该组块只有一个词以句法组块标注训练为例,我们先将 宾州树 的标注使用 perl 小程序作如下转化,..._crf bio