暖石网
nuanshi

转行运营系统课 >搜索引擎工作原理

搜索引擎工作原理

完整地理解搜索引擎的工作原理是SEO人员必备的基础知识

搜索引擎工作原理12分52秒
完整地理解搜索引擎的工作原理是SEO人员必备的基础知识
课程问答
Ray740,灰蒙蒙
2016-10-08 14:10
老师,你这节课讲的是搜索引擎的工作原理,有点像垃圾回收,虽然这个举例不恰当,行为类似吧:1搜索引擎的爬虫或bot去每个网页爬,然后把爬过的所有页面抓取后存到库里(只要路过的地方都捡回来);2然后搜索引擎开始对抓回来的页面进行一些处理、归类(捡回来后看看哪些有用,或者说捡回来个铁罐,只有铁值钱,里面的垃圾不要了,就得把铁罐倒空再拿回来。还有哪些个值钱…建个list)3根据用户搜索词处理后的结果进行匹配,根据结果相关性和权重高低进行排名。(去卖废品的时候,对方正好要个铁罐,我这个完整还处理干净了是最适合的,然后我还是个口碑卖家)……排名这我有点乱了
馒头老师 2016-10-08 22:54

你已经解释的没有问题了,这个排名会根据网站权重、关键词匹配程度多个因素综合计算的,用你自己的例子来说,有人来收铁罐,你家口碑好,产品好,他会有限选择你家。

Ray740 2016-10-09 01:03
O(∩_∩)O谢谢
6人觉得有帮助 有帮助
墨非,学有价值的东西,做最好的自己
2016-08-01 18:12
以前老听说爬虫,现在知道了是搜索引擎用的。那这个爬虫是不是无时无刻都在所有的网站上收取信息?还有就是那个关键词问题,在存库的时候,将信息与关键词对应,是不是每一个词汇都是关键词(用户可能收索任何一个词)然后对应建库存放信息的?
馒头老师 2016-08-02 17:56

爬虫是一直在抓取,但是并不是所有网站,爬虫是有限的,不可能同时在所有网站上抓取。存库的时候会把关键词收录到搜索引擎的数据库,然后根据用户搜索的关键词,每个关键词会对应到数据库的索引,然后得到相应搜索结果,最后根据网站的权重来进行排序。

4人觉得有帮助 有帮助
游鱼飞天,人艰不拆,生活仍要开开心心的。公号:乐活走全球
2018-09-10 14:20

老师,请问爬虫是只能抓取文字内容的,对吗?如果是图片,加标签也能抓取,标签是指什么?谢谢!

牛小kk 2018-09-10 23:12

爬虫爬到的都是一行一行代码。所以抓取到主要是文字内容,如果抓取的图片,那么获得一行代码表示图片,爬虫并不知道图片本身显示的是什么内容,所以给图片标签加title、alt这种属性,爬虫抓取的时候就能获知图片和这些属性里的文字相关

游鱼飞天 2018-09-11 15:02
谢谢!
3人觉得有帮助 有帮助
小民
2017-07-26 22:17
老师,我看到说给自己网站增加优质原创内容或者是更新网站内容有助于增加网站权重,可是一般像社交类的网站才会有用户在里面不断更新内容,我们正常一个做产品的网站,不会有用户在上面产生内容,我们自己一般也不会经常更新内容。那是不是就不会考虑在这方面增加网站权重了呢?
牛小kk 2017-07-27 10:03

如果自己的产品网站,那么内容必然是少,更新内容可以不作为重点。可以从其他方面入手

小民 2017-08-02 09:57
其他方面表示您最课程上提到的比如网站结构、URL、站外链接等这种么?还有一个问题,我对外链的理解很模糊,感觉除了友情链接,还有找一些社交渠道发布文章然后贴上自己网站的链接。有说建立外部链接,有说寻求高质量的外链。这两者分别都是什么概念呢?
牛小kk 2017-08-02 10:47

1 其他方面,课程提到的是一些优化内容,是值得做的。

2 外链,对于你的网站来讲,那就是把你的网站链接放在你的网站以外的地方,这些都成为外链。建立外部链接和寻求高质量外链其实说的是一件事,做好的外链,并不是乱建立外链,先找高质量的外链处,再试图去建立外链

小民 2017-08-02 14:31
可是怎样才算是高质量的外链处呢?感觉有点像之前在知乎找问答一样。问题有点多,先谢过老师的耐心回答!
牛小kk 2017-08-02 17:51

没关系,有问题,不用担心多不多,只管问。

回到正题,如何判断外链处的好坏呢,首先可以看下权重是否高,越高越好。看流量是否大,流量大意味着能给你网站带来流量的机会更多。还有外链放在行业内垂直的比较有名的网站,这样流量更加精准,也是好的外链处。初步判断是这么做,但实际,我们放了外链,对不同的外链需要加上监测,回收数据,通过数据能准确地看出哪些外链质量高,带来的流量多,也能看出是否和最初判断一致

2人觉得有帮助 有帮助
黑芝麻糊,努力让自己过上更好的生活
2016-05-14 18:17
智商不够,第一步,提取文字,把爬虫中抓出的文章中出现的,如,何,治,疗,鼻,炎提取出,第二步分词,是进一步把,如何,治疗,鼻炎,提取出?
牛小kk 2016-05-15 18:16

提取文字:主要指的是提取页面中主要信息,并没有对词、句子进行任何的拆分,提取出页面标题、描述、重要标签、链接内的文字。比如提取标题“本文告诉你如何从生活习惯上治疗季节性鼻炎”

分词:才会对提取的文字进行拆分,比如“如何”“治疗”“鼻炎”“治疗鼻炎”等

2人觉得有帮助 有帮助
微观世界,动静相宜
2018-02-09 15:03

老师好!产品工具类型的网站,一般内容比较少,内容一般不会太多,从其它方面优化提升网站流量和收录,要怎么规划和入手啊?目前网站seo内部优化方面,我们已经弄好了!接下来要怎么规划呢!网站刷关键词,整站刷了49个词(第三方刷的),友链也是买的,好的友链留下了,不好的就没弄。然后定期更新产品公告,优化新增的功能产品说明。权重是上升了,但收录上不去三个月了,现在不知道怎么班!见了三个分站,收录比官网要好一点,主站官网不知怎么办了!;老师帮我梳理一些新的思路和方法。多谢了!!!

牛小kk 2018-02-10 11:26

说句实话,产品工具类的网站没有内容都是一些介绍性的页面非常难提升流量和收录,因为网站没什么东西可做内容的,没有持续内容产生。这种介绍型网站想要流量就得花钱买流量,想提高收录的方向就不太对。内容型的网站增加收录才更有用,才容易带来搜索流量

1人觉得有帮助 有帮助
Danny,没有个性,所以没有个性签名
2017-04-22 12:22
若一个页面我想优化的关键词是A,那该如何引导百度在预处理时判定该页面对应的关键词是A,而非BCD等其他关键词
牛小kk 2017-04-23 09:32

那你的title以及页面正文标题就很重要了,关键词A一定是重点要出现,且具有语义化

1人觉得有帮助 有帮助
黑芝麻糊,努力让自己过上更好的生活
2016-05-14 18:28
去停止词是不是,如果我发了一篇,如何治疗鼻炎啊?,在搜索引擎里就不会被搜到了?还是排名靠后?
牛小kk 2016-05-15 18:19

如果你发了一篇“如何治疗鼻炎啊”,但是其他人搜索“如何治疗鼻炎”,依然是可以被搜索的,你加的“啊”字对搜索引擎来说是干扰,不管你发的内容是“如何治疗鼻炎”还是“如何治疗鼻炎啊”,这个对排名基本没有影响,对排名有影响的是内容的相关度和网页的权重,内容越相关权重越高的页面当然在搜索结果越靠前(当然这里我们忽略哪些付费推广)

1人觉得有帮助 有帮助
黑芝麻糊,努力让自己过上更好的生活
2016-05-14 18:12
其他条件一致,爬虫范围越广的,搜索效果越好?预处理是让搜索结果更加精准?
牛小kk 2016-05-15 18:10

“爬虫范围越广”这里没有明白爬虫的什么范围

预处理就是搜索引擎把抓取的内容进行提取有效信息,排除干扰信息。这个是对抓取数据的处理,有利于为用户展示更加精准的搜索结果

1人觉得有帮助 有帮助
当年情,2019学习,改变,学习改变!
2020-01-03 08:45

老师,帮我看一下这篇站内文章,昨天写的,今天提示没有找到URL,这个是怎么回事儿?网上说百度把网站给K了?顿时感觉害怕怕……之前的文章已经被百度收录了4篇了。请老师分析一下

捕获.PNG

半亩老师 2020-01-03 11:04

同学不好意思,seo方面我们也是基础操作,主要业务不集中在这一块,所以这种基于机制的问题,老师也不是很了解背后的原因,我们面临这类情况的经验是直接申诉或是找客服,直接找百度推广的联系方式就可以,反而能及时得到一些反馈,同学可以参考一下。

0人觉得有帮助 有帮助
沙渐冰峰,没有签名
2017-11-11 21:41
我们公司网站做SEO工作时会在标题里面加入要做的关键词,这个主要目的是什么?
牛小kk 2017-11-13 12:51

可以再继续听下关于页面标题的这节课

0人觉得有帮助 有帮助
听得到,做点有意义的事,顺便过上更好的生活。
2017-08-09 19:09
不同的浏览器,用相同的搜索引擎搜索相同的内容,呈现出的结果是一样的吧?
牛小kk 2017-08-09 20:01

有可能会产生一些不同。

首先如何搜索内容有推广的广告,你会看到推送的广告不同。另外不同浏览器的搜索记录和浏览记录不同,可能会产生不同结果,但大体一致。

听得到 2017-08-10 09:21
搜索记录和浏览记录不同,可能会产生不同结果------为什么?
牛小kk 2017-08-10 10:13

搜索结果会结合搜索内容以及当前浏览器用户的信息(包括地理、性别、以往搜索浏览记录等)来呈现结果。比如针对搜索小孩外语培训,那么不同地理位置就会呈现出不同结果,针对本地的一些搜索结果。

0人觉得有帮助 有帮助
西红柿炒鸡蛋,不在旅行途中,就在准备的路上
2017-05-06 10:10
请问老师,这3个大步骤是在用户搜索某一个词的时候瞬间完成的吗?
牛小kk 2017-05-06 21:42

不是的,前两个阶段其实是在你搜索之前,搜索引擎已经完成了的工作。

0人觉得有帮助 有帮助
Danny,没有个性,所以没有个性签名
2017-04-22 11:48
1、「爬行和抓取」中的抓取指的是不是收录;2、蜘蛛每爬行过的页面它都会抓取吗;3、若蜘蛛爬了10个页面,最后通过site查到只收录了1个,这是什么原因呢,怎么增加收录量
牛小kk 2017-04-23 09:18

1 抓取了不一定收录,收录一定抓取过。

2 爬行过不一定会抓取

3 只收录了一个,原因很多,比如不让页面不让抓取或者抓取了但是内容有作弊、垃圾内容等,搜索引擎并没有收录。所以增加收录要先检查自身,是否因为设置不能抓取或者禁止爬虫访问的障碍导致收录低下,如果是修改设置,如果不是,进一步增加优质原创内容以及通过其他方式先提高自己网站的权重

0人觉得有帮助 有帮助
沙渐冰峰,没有签名
2016-11-27 09:52
中文分词是对爬行提取文字进行分词,还是对用户的搜索词语进行分词
馒头老师 2016-11-28 14:44

爬取的时候会分词,用户搜索的时候也会进行分词

0人觉得有帮助 有帮助
Amou,学习中
2016-09-12 13:06
问题2,SEM和SEO先学哪个会效率最大化? 谢谢老师!
馒头老师 2016-09-12 22:10

这是两个不同的方法,跟你自己的关键词的转化率也会有关,SEM是一个见效更快的方法,SEO是一个长期的,性价比更高的方法。

0人觉得有帮助 有帮助
Amou,学习中
2016-09-12 13:04
老师,请问一下爬虫是只抓取网页的内容代码是吗?一个网站全都是图片的话,可以在代码里面添加相关的文字是这样理解吗?谢谢!
馒头老师 2016-09-12 14:21

爬虫抓取网页内容还有title,在图片加上相关标签可以帮助搜索引擎抓取。

0人觉得有帮助 有帮助
流逝之云,知行合一!
2016-06-10 19:45
我觉得挺好:抓取,建库,分析(预处理),排名。这是之前我学过的工作原理
牛小kk 2016-06-11 14:28

你所说的建库其实也是属于预处理的一部分,如果要拆分成4个步骤那当然也是没问题的,只要理解过程即可

0人觉得有帮助 有帮助
李先生,有梦想的伪文艺青年
2016-05-14 20:33
声音小,声音小,听着累。
牛小kk 2016-05-15 18:11

非常抱歉,会改进

0人觉得有帮助 有帮助
黑芝麻糊,努力让自己过上更好的生活
2016-05-14 18:34
老师,不好意思,问得有点多了,预处理是基于页面去提取文字的吗?所以消除噪音是把和搜索结果无关给消除掉?
牛小kk 2016-05-15 18:22

预处理是基于抓取的页面来提取文字的。消除噪音是把和搜索结果无关的内容去掉,减少干扰,这就像你考试时写出文章大意,你的文章大意肯定是没有废话的

0人觉得有帮助 有帮助

搜索引擎工作原理

完整地理解搜索引擎的工作原理是SEO人员必备的基础知识

< 返回课程表
展开全部
课程问答
2016-10-08 14:10
老师,你这节课讲的是搜索引擎的工作原理,有点像垃圾回收,虽然这个举例不恰当,行为类似吧:1搜索引擎的爬虫或bot去每个网页爬,然后把爬过的所有页面抓取后存到库里(只要路过的地方都捡回来);2然后搜索引擎开始对抓回来的页面进行一些处理、归类(捡回来后看看哪些有用,或者说捡回来个铁罐,只有铁值钱,里面的垃圾不要了,就得把铁罐倒空再拿回来。还有哪些个值钱…建个list)3根据用户搜索词处理后的结果进行匹配,根据结果相关性和权重高低进行排名。(去卖废品的时候,对方正好要个铁罐,我这个完整还处理干净了是最适合的,然后我还是个口碑卖家)……排名这我有点乱了
馒头老师 2016-10-08 22:54

你已经解释的没有问题了,这个排名会根据网站权重、关键词匹配程度多个因素综合计算的,用你自己的例子来说,有人来收铁罐,你家口碑好,产品好,他会有限选择你家。

Ray740 2016-10-09 01:03
O(∩_∩)O谢谢
6人觉得有帮助 有帮助
2016-08-01 18:12
以前老听说爬虫,现在知道了是搜索引擎用的。那这个爬虫是不是无时无刻都在所有的网站上收取信息?还有就是那个关键词问题,在存库的时候,将信息与关键词对应,是不是每一个词汇都是关键词(用户可能收索任何一个词)然后对应建库存放信息的?
馒头老师 2016-08-02 17:56

爬虫是一直在抓取,但是并不是所有网站,爬虫是有限的,不可能同时在所有网站上抓取。存库的时候会把关键词收录到搜索引擎的数据库,然后根据用户搜索的关键词,每个关键词会对应到数据库的索引,然后得到相应搜索结果,最后根据网站的权重来进行排序。

4人觉得有帮助 有帮助
2018-09-10 14:20

老师,请问爬虫是只能抓取文字内容的,对吗?如果是图片,加标签也能抓取,标签是指什么?谢谢!

牛小kk 2018-09-10 23:12

爬虫爬到的都是一行一行代码。所以抓取到主要是文字内容,如果抓取的图片,那么获得一行代码表示图片,爬虫并不知道图片本身显示的是什么内容,所以给图片标签加title、alt这种属性,爬虫抓取的时候就能获知图片和这些属性里的文字相关

游鱼飞天 2018-09-11 15:02
谢谢!
3人觉得有帮助 有帮助
2017-07-26 22:17
老师,我看到说给自己网站增加优质原创内容或者是更新网站内容有助于增加网站权重,可是一般像社交类的网站才会有用户在里面不断更新内容,我们正常一个做产品的网站,不会有用户在上面产生内容,我们自己一般也不会经常更新内容。那是不是就不会考虑在这方面增加网站权重了呢?
牛小kk 2017-07-27 10:03

如果自己的产品网站,那么内容必然是少,更新内容可以不作为重点。可以从其他方面入手

小民 2017-08-02 09:57
其他方面表示您最课程上提到的比如网站结构、URL、站外链接等这种么?还有一个问题,我对外链的理解很模糊,感觉除了友情链接,还有找一些社交渠道发布文章然后贴上自己网站的链接。有说建立外部链接,有说寻求高质量的外链。这两者分别都是什么概念呢?
牛小kk 2017-08-02 10:47

1 其他方面,课程提到的是一些优化内容,是值得做的。

2 外链,对于你的网站来讲,那就是把你的网站链接放在你的网站以外的地方,这些都成为外链。建立外部链接和寻求高质量外链其实说的是一件事,做好的外链,并不是乱建立外链,先找高质量的外链处,再试图去建立外链

小民 2017-08-02 14:31
可是怎样才算是高质量的外链处呢?感觉有点像之前在知乎找问答一样。问题有点多,先谢过老师的耐心回答!
牛小kk 2017-08-02 17:51

没关系,有问题,不用担心多不多,只管问。

回到正题,如何判断外链处的好坏呢,首先可以看下权重是否高,越高越好。看流量是否大,流量大意味着能给你网站带来流量的机会更多。还有外链放在行业内垂直的比较有名的网站,这样流量更加精准,也是好的外链处。初步判断是这么做,但实际,我们放了外链,对不同的外链需要加上监测,回收数据,通过数据能准确地看出哪些外链质量高,带来的流量多,也能看出是否和最初判断一致

2人觉得有帮助 有帮助
2016-05-14 18:17
智商不够,第一步,提取文字,把爬虫中抓出的文章中出现的,如,何,治,疗,鼻,炎提取出,第二步分词,是进一步把,如何,治疗,鼻炎,提取出?
牛小kk 2016-05-15 18:16

提取文字:主要指的是提取页面中主要信息,并没有对词、句子进行任何的拆分,提取出页面标题、描述、重要标签、链接内的文字。比如提取标题“本文告诉你如何从生活习惯上治疗季节性鼻炎”

分词:才会对提取的文字进行拆分,比如“如何”“治疗”“鼻炎”“治疗鼻炎”等

2人觉得有帮助 有帮助
2018-02-09 15:03

老师好!产品工具类型的网站,一般内容比较少,内容一般不会太多,从其它方面优化提升网站流量和收录,要怎么规划和入手啊?目前网站seo内部优化方面,我们已经弄好了!接下来要怎么规划呢!网站刷关键词,整站刷了49个词(第三方刷的),友链也是买的,好的友链留下了,不好的就没弄。然后定期更新产品公告,优化新增的功能产品说明。权重是上升了,但收录上不去三个月了,现在不知道怎么班!见了三个分站,收录比官网要好一点,主站官网不知怎么办了!;老师帮我梳理一些新的思路和方法。多谢了!!!

牛小kk 2018-02-10 11:26

说句实话,产品工具类的网站没有内容都是一些介绍性的页面非常难提升流量和收录,因为网站没什么东西可做内容的,没有持续内容产生。这种介绍型网站想要流量就得花钱买流量,想提高收录的方向就不太对。内容型的网站增加收录才更有用,才容易带来搜索流量

1人觉得有帮助 有帮助
2017-04-22 12:22
若一个页面我想优化的关键词是A,那该如何引导百度在预处理时判定该页面对应的关键词是A,而非BCD等其他关键词
牛小kk 2017-04-23 09:32

那你的title以及页面正文标题就很重要了,关键词A一定是重点要出现,且具有语义化

1人觉得有帮助 有帮助
2016-05-14 18:28
去停止词是不是,如果我发了一篇,如何治疗鼻炎啊?,在搜索引擎里就不会被搜到了?还是排名靠后?
牛小kk 2016-05-15 18:19

如果你发了一篇“如何治疗鼻炎啊”,但是其他人搜索“如何治疗鼻炎”,依然是可以被搜索的,你加的“啊”字对搜索引擎来说是干扰,不管你发的内容是“如何治疗鼻炎”还是“如何治疗鼻炎啊”,这个对排名基本没有影响,对排名有影响的是内容的相关度和网页的权重,内容越相关权重越高的页面当然在搜索结果越靠前(当然这里我们忽略哪些付费推广)

1人觉得有帮助 有帮助
2016-05-14 18:12
其他条件一致,爬虫范围越广的,搜索效果越好?预处理是让搜索结果更加精准?
牛小kk 2016-05-15 18:10

“爬虫范围越广”这里没有明白爬虫的什么范围

预处理就是搜索引擎把抓取的内容进行提取有效信息,排除干扰信息。这个是对抓取数据的处理,有利于为用户展示更加精准的搜索结果

1人觉得有帮助 有帮助
2020-01-03 08:45

老师,帮我看一下这篇站内文章,昨天写的,今天提示没有找到URL,这个是怎么回事儿?网上说百度把网站给K了?顿时感觉害怕怕……之前的文章已经被百度收录了4篇了。请老师分析一下

捕获.PNG

半亩老师 2020-01-03 11:04

同学不好意思,seo方面我们也是基础操作,主要业务不集中在这一块,所以这种基于机制的问题,老师也不是很了解背后的原因,我们面临这类情况的经验是直接申诉或是找客服,直接找百度推广的联系方式就可以,反而能及时得到一些反馈,同学可以参考一下。

0人觉得有帮助 有帮助
2017-11-11 21:41
我们公司网站做SEO工作时会在标题里面加入要做的关键词,这个主要目的是什么?
牛小kk 2017-11-13 12:51

可以再继续听下关于页面标题的这节课

0人觉得有帮助 有帮助
2017-08-09 19:09
不同的浏览器,用相同的搜索引擎搜索相同的内容,呈现出的结果是一样的吧?
牛小kk 2017-08-09 20:01

有可能会产生一些不同。

首先如何搜索内容有推广的广告,你会看到推送的广告不同。另外不同浏览器的搜索记录和浏览记录不同,可能会产生不同结果,但大体一致。

听得到 2017-08-10 09:21
搜索记录和浏览记录不同,可能会产生不同结果------为什么?
牛小kk 2017-08-10 10:13

搜索结果会结合搜索内容以及当前浏览器用户的信息(包括地理、性别、以往搜索浏览记录等)来呈现结果。比如针对搜索小孩外语培训,那么不同地理位置就会呈现出不同结果,针对本地的一些搜索结果。

0人觉得有帮助 有帮助
2017-05-06 10:10
请问老师,这3个大步骤是在用户搜索某一个词的时候瞬间完成的吗?
牛小kk 2017-05-06 21:42

不是的,前两个阶段其实是在你搜索之前,搜索引擎已经完成了的工作。

0人觉得有帮助 有帮助
2017-04-22 11:48
1、「爬行和抓取」中的抓取指的是不是收录;2、蜘蛛每爬行过的页面它都会抓取吗;3、若蜘蛛爬了10个页面,最后通过site查到只收录了1个,这是什么原因呢,怎么增加收录量
牛小kk 2017-04-23 09:18

1 抓取了不一定收录,收录一定抓取过。

2 爬行过不一定会抓取

3 只收录了一个,原因很多,比如不让页面不让抓取或者抓取了但是内容有作弊、垃圾内容等,搜索引擎并没有收录。所以增加收录要先检查自身,是否因为设置不能抓取或者禁止爬虫访问的障碍导致收录低下,如果是修改设置,如果不是,进一步增加优质原创内容以及通过其他方式先提高自己网站的权重

0人觉得有帮助 有帮助
2016-11-27 09:52
中文分词是对爬行提取文字进行分词,还是对用户的搜索词语进行分词
馒头老师 2016-11-28 14:44

爬取的时候会分词,用户搜索的时候也会进行分词

0人觉得有帮助 有帮助
2016-09-12 13:06
问题2,SEM和SEO先学哪个会效率最大化? 谢谢老师!
馒头老师 2016-09-12 22:10

这是两个不同的方法,跟你自己的关键词的转化率也会有关,SEM是一个见效更快的方法,SEO是一个长期的,性价比更高的方法。

0人觉得有帮助 有帮助
2016-09-12 13:04
老师,请问一下爬虫是只抓取网页的内容代码是吗?一个网站全都是图片的话,可以在代码里面添加相关的文字是这样理解吗?谢谢!
馒头老师 2016-09-12 14:21

爬虫抓取网页内容还有title,在图片加上相关标签可以帮助搜索引擎抓取。

0人觉得有帮助 有帮助
2016-06-10 19:45
我觉得挺好:抓取,建库,分析(预处理),排名。这是之前我学过的工作原理
牛小kk 2016-06-11 14:28

你所说的建库其实也是属于预处理的一部分,如果要拆分成4个步骤那当然也是没问题的,只要理解过程即可

0人觉得有帮助 有帮助
2016-05-14 20:33
声音小,声音小,听着累。
牛小kk 2016-05-15 18:11

非常抱歉,会改进

0人觉得有帮助 有帮助
2016-05-14 18:34
老师,不好意思,问得有点多了,预处理是基于页面去提取文字的吗?所以消除噪音是把和搜索结果无关给消除掉?
牛小kk 2016-05-15 18:22

预处理是基于抓取的页面来提取文字的。消除噪音是把和搜索结果无关的内容去掉,减少干扰,这就像你考试时写出文章大意,你的文章大意肯定是没有废话的

0人觉得有帮助 有帮助
零基础转行系统课