关于网络爬虫协议文件robots.txt,说法错误的是()
第1题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第2题:
A、增量式网络爬虫
B、聚焦网络爬虫
C、DeepWeb爬虫
D、全网爬虫
第3题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第4题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第5题:
此题为判断题(对,错)。
第6题:
A、网络爬虫还可以对网页建立索引
B、有些网络爬虫能够从网站抓取内容聚合起来
C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等
D、隐藏在表单后的信息无法被网络爬虫发现
第7题:
此题为判断题(对,错)。
第8题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第9题:
A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
第10题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫