搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。
搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。哈尔滨SEO蜘蛛程序发出页面访问请求后, 服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行 和抓取速度,都使用多个蜘蛛并发分布爬行。
哈尔滨SEO广度优先是指蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面上发现的链接爬向第三层页面。
如上图所示,蜘蛛从A页面顺着链接爬行到A1,B1,C1页面,哈尔滨SEO直到A页面上的所有链接都爬行完,然后再从A1页面发现的下一层链接,爬行到A2,A3,A4......页面。
从理论上说,无论是深度优先还是广度优先,哈尔滨SEO只要给蜘蛛足够的时间,都能爬完整个互联网。
|