中文自然语言处理示例__LSTM with Attention Model运用于中文医学报告预测_Part1_token_lookup missing symbols: {'-'}-CSDN博客

网站介绍:文章浏览阅读752次。中文的自然语言处理和不像英语那么方便,要遇到各种各样的问题. 几个大方向,除了删去一些data里原本的错误之外,还要创造中文和数字的字典,替代中文中的特殊字符,还要处理文本,保持长度的一致,等等. Part1主要是在model之前,讲讲如何preprocess中文文本. 话不多说,现在开始啦. data长这样,15997个obs, 目的是用description predict conclusio..._token_lookup missing symbols: {'-'}