u012905439的专栏

Python自然语言处理

去相应的[官网下载Python](),安装后,运行:Pyhon是一种解释器,,交互友好,可以利用交互式开发环境Interactive DeveLopment Environment,简称IDLE的图形接口来访问Pyhon解释器。

下载nltk,[nltk官网](),下载好后。在IDLE中输入>>> import nltk>>> nltk.download()会出现以下界面:

选择collections,点击book,进行下载book模块:

一旦数据被下载到你的机器,就可以适用Python解释器加载。第一步,在Python提示符后输入: from nltk.book import * 意思是:从NLTK的book模块加载所有的东西 ,加载的几本书的文本内容。

搜索文本使用的函为:concordance()

检索相似的文本用:similar() 检索两个活两个以上的词共同的上下文: common_contexts()

查找整个文本的不重复的词语用函数:sorted(set(…)) 计数用 len()

计数一个词在文本中出现的次数,计算一个特定的词在文本中占据的百分比:

定义函数,可重复利用:

而是他们在同伴们都睡着的时候,一步步艰辛地

u012905439的专栏

相关文章:

你感兴趣的文章:

标签云: