暖石网
【改价通知】现3580转行求职套餐,将于10月31日晚22点下架停售。现在购买,仍可享受套餐下所有学习服务,点击立即抢购!
nuanshi
登录 | 注册
学员问答    >    查看问答
智商不够,第一步,提取文字,把爬虫中抓出的文章中出现的,如,何,治,疗,鼻,炎提取出,第二步分词,是进一步把,如何,治疗,鼻炎,提取出?
黑芝麻糊 2016-05-14 18:17
相关课程:实操课程系列 > SEO > 搜索引擎工作原理
下一条问答 / 上一条问答
牛小kk 2016-05-15 18:16

提取文字:主要指的是提取页面中主要信息,并没有对词、句子进行任何的拆分,提取出页面标题、描述、重要标签、链接内的文字。比如提取标题“本文告诉你如何从生活习惯上治疗季节性鼻炎”

分词:才会对提取的文字进行拆分,比如“如何”“治疗”“鼻炎”“治疗鼻炎”等

这个问答对你有帮助吗?
有帮助