首先,了解一下什么是爬虫?
爬虫(被称为网页蜘蛛或网络中的机器人)是搜索引擎最核心的一部分,是搜索引擎利用爬虫进行页面收集与分析的重要工作。
这下我就给大家讲解一下我对爬虫的了解及假象和近期的实验总结。
爬虫的任务:
1,收集URL并给出反馈值。
2,抓取页面信息。
3,归拢、归类URL地址池,保存到搜索引擎库,待预处理。
4,地址池的归类。
5,进行计算及分析处理。
6,循环地址池并更新查找出最新的URL,直至没有出现新的URL。
7,对页面url的重要程序进行排序。
这里基本都是我本人的个人理解与发现,其实这只是很笼统的讲解,还需细分化,那我对爬虫的假象也有几点,如:爬虫可以跳出循环、爬虫可以计算字节、爬虫可以把抓到的URL归大项等等。
近期小黑做的SEO实验就说到这,如果有需要更深入的了解和分析,不妨加入我们的QQ群一并讨论,让搜搜引擎不在神秘,让大家更了解搜索引擎。
最后一句话是给在做SEO朋友的,SEO并非容易掌握,只有深入研究探索与发现才能使你进步,否则都是无用功。



搜索引擎原理 3 Comments