文章浏览阅读4k次。人工智能:文本去掉停用词stopwords为了彻底搞懂本质,写的非常细!(1)准备停用词import pandas as pdimport jieba# 准备停用词stopwords = pd.read_csv("data/stopwords.txt", index_col=False, quoting=3, sep='\t', names=['word'], enco......
2024-01-22 22:07 阅读 阅读全文文章浏览阅读1.1k次。百度智能云API 接口的使用应该说是很方便的。但是网上代码资源不多,还有运行不了的代码,误导了我很久。在此发文一篇,分享2021年12月30日可运行代码,并实现了对比两段事件描述相似度的功能。import j......
2024-01-24 20:13 阅读 阅读全文资源浏览查阅49次。nlp中的主题模型,谈起LDA,自然需要引入pLSA。pLSA是用一个生成模型来建模文章的生成过程。假设有K个主题,M篇文章;对语料库中的任意文章d,假设该文章有N个词,则对于其中的每一个词,我们首先选择一个......
2024-01-25 05:27 阅读 阅读全文问题记录Task1 问题1 当训练样本很多的时候,每次打开程序再次读取都要耗费很长的时间,持久化的话可否压缩占用的空间,有没有更好地节约时间的方法?2 训练好的模型怎么保存及重新调用3 TensorFlow 2.0和1.0的选择3 cnews_loader......
2023-10-14 02:36 阅读 阅读全文文章浏览阅读2.7k次,点赞11次,收藏46次。个人研究的各种乱七八糟无聊资料~:深入看过的论文:链接:https://pan.baidu.com/s/19mlS8eSY8vbzr96FPYfOvw提取码:vy3o 期待深入看的论文链接:https://pan.baidu.com/s/1-OT3c-xdKvxQGe_n8pMT7A提取码:kc1n B......
2024-01-25 05:23 阅读 阅读全文NLP分类方法历史词袋模型(1954)One-hotTF-IDFN-gram主题模型(1998)LSApLSALDA词嵌入(word embedding)word2vec(2013)Skip-gramCbowGlove词袋模型(1954)相关文章:词袋模型简要概述和发展史使用向量表示文章/句子,向量中每一个维度表示一......
2023-10-10 04:15 阅读 阅读全文文章浏览阅读1.1w次,点赞6次,收藏8次。摘要:通过对数据的抓取,基于jieba分词,去掉停用词,运用Gensim建立词典,生成BOW语料,运行tfidf模型计算词权重,采用LsiModel进行降维,最后运用Gensim提供的MatrixSimilarity类来计算两文......
2024-01-24 06:39 阅读 阅读全文资源浏览查阅184次。NLP技术分享深度学习与自然语言处理舆情分析、智能聊天机器人【课程列表】1、自然语言处理2nlp舆情分析更多下载资源、学习资料请访问CSDN文库频道....
2024-01-24 20:22 阅读 阅读全文NLP蜗牛擅长ccf,深度学习入门,tensorflow学习,等方面的知识,NLP蜗牛关注tensorflow,nlp,数据分析,机器学习,深度学习,自然语言处理,神经网络领域....
2024-01-25 05:22 阅读 阅读全文