关于网络爬虫协议文件robots.txt,说法错误的是()

题目

关于网络爬虫协议文件robots.txt,说法错误的是()

  • A、一个网站可以放多个不同robots文件
  • B、robots文件不可以用xml格式命名
  • C、disallow用来描述不希望被访问到的一个URL
  • D、robots文件可以放在任何位置
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

()实现的两个主要目标为保持本地页面集中存储的页面为最新页面和提高本地页面集中页面的质量。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:B

第2题:

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

A、增量式网络爬虫

B、聚焦网络爬虫

C、DeepWeb爬虫

D、全网爬虫


参考答案:B

第3题:

()爬行过程中最重要部分就是表单填写及处理。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:D

第4题:

()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:B

第5题:

聚焦网络爬虫和通用网络爬虫相比,增加了链接评价模块以及内容评价模块。()

此题为判断题(对,错)。


参考答案:正确

第6题:

以下关于网络爬虫的说法,不正确的是()。

A、网络爬虫还可以对网页建立索引

B、有些网络爬虫能够从网站抓取内容聚合起来

C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等

D、隐藏在表单后的信息无法被网络爬虫发现


参考答案:D

第7题:

网络爬虫技术不支持图片、音频、视频等文件或附件的采集。()

此题为判断题(对,错)。


参考答案:错误

第8题:

()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:D

第9题:

关于各种网络爬虫,以下说法不正确的是()。

A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。

B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。

C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。

D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面


参考答案:D

第10题:

()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:B

更多相关问题