这篇文章,小编来跟大家分享的内容是关于谷歌的搜索特色~
Google的一些特色包括:支持多种搜索语言,种数达到了上百种;搜索速度快,据说Google拥有8000多台服务器,200多条T3级别的宽带;Google还拥有专利网页级别技术PageRank,可以提供高命中率的搜索结果;Google的智能化的手气不错功能,可以提供最符合要求的网,谷歌涂鸦是谷歌于节日和其他纪念日在主页上展示的定制版谷歌图标,如搜一下日本的:
在这里就不一一列举了。
为了做更深入了了解,我们还是先来学习一下Google的搜索语法。谷歌的搜索语法分成了两大类,一类是基本语法,另一类就是高级语法了。这一次,就先介绍一下Google的基本语法。
基本语法
1)谷歌的默认搜索是and逻辑,意思就是,我们在输入关键字后进行搜索时,如输入:computer google后,会搜出包含computer和google的文件内容,如图:
说到这里,给大家插入一个小知识点:基础布尔逻辑。
对于一个搜索引擎来说,进行搜索的时候是要搜索和匹配到所有关键词的页面,还是包含关键词中的任意关键词?,取决于一个搜索引擎的一些特别算法,称之为搜索引擎的布尔逻辑默认值。而google就是用and作为默认逻辑(搜索到所有的关键词),当然这个前提是我们没有输入一些特殊的命令。
2)如果你不确定你要搜索的内容,或者你想搜索两个中的任意一个,那么就要使用关键词OR。注意:OR是大写的,小写是不起作用的,而且,每一个关键词与OR之间是有一个空格的,当然了,除了OR,|也是或的意思。我们来看一下搜索结果。
搜到的结果是包含computer字样或Google字样的页面。
3)如果我们在字母之间不想插入任何东西,即我就想搜computerGoogle那么可以输入computerGoogle【注:字符用双引号引起来】:
如上图所示,结果中的computerGoogle都是在一起的,没有分割。当然这样的结果比较少,只有2940个,但是看图2,结果却有18亿多个。而且,大部分搜索引擎都有智能断句的功能,如果没有特殊的命令,搜索引擎会一定量的根据大众的语言使用习惯来判断你要搜索什么,而这样的做法,不仅仅没有使搜索引擎显得不听话,反而对大众来讲搜索引擎变得十分智能和高效!
4)如果我们只想显示computer,而不想看到Google,那么我们看可以这样输入:在computer后面加一个空格,然后减号-Google,即:computer -Google:
5)一般来说,当输入关键词后,google会把相关网页和信息的结果呈现在我们面前。然而,有一些单词在搜索引擎中是会被智能忽略的,导致我们得不到想要的结果。比如十分常用的www和the,基本上任何一个网页上都会找到的东西,就会被google自动忽略(不要觉得这样不好,还是那个道理,在实际引用当中这样做反而显得更加高效和智能)。如果我们不想忽略这些词进行查询,就得在这些关键词的前面加上符号+。如下图:
这样就很明显,如果过滤掉www,那么相当于谷歌只搜索字样Google,所以搜到的信息远远比加上www要丰富的多。
高级语法
1)intitle
首先要介绍的就是intitle:的用法,这个串的作用是将搜索的范围局限在标题上。在关键词前面加上这个,就会只对网页的标题进行搜索并且配对,最后将结果返回给用户。例如输入intitle YouTube computer进行搜索,就会返回如下图所示:
但是可以看到,貌似搜索结果中只出现了关于YouTube的内容,而computer相关的内容很少,这里其实还是牵扯到搜索引擎的基础布尔逻辑问题,在intitle:语法上,google会检索所有的网页,只要出现YouTube或者computer其中的一个就会被匹配,意料之中的是,关于YouTube的内容肯定是要远远多于computer的内容,所以搜索结果里关于YouTube的内容占据了主导,但是如果我们想要找到网页标题中既有YouTube又有computer的网页,我们就要使用intitle:的一个变体allintitle:,使用这个前缀后,就能得到我们想要的结果了。如下图所示:
2)intext
看到这个单词,大概就可以猜到它的意义了,intext:是用来搜索网页正文内容的,这样就可以忽略网页中的超文本链接、URL和题目。我们输入intext:2018 tjut进行搜索,结果如下图所示,结果中显示的网页大部分标题几乎没有规律,但是网页的索引中都包含着 2020 tjut,但是因为2020和tjut的同时出现的网页实在比较少,两个关键词的关联度实在不高,因为现在才是2018年,如果换成2018 tjut我相信应该会有更多的结果出现。但是我们要明白,这时搜索引擎关注的内容是网页的正文。与之相对应的也有一个变体:allintext:,用法和上面的allintitle相似,这里就不做过多的介绍了。
3)inanchor(锚mao点)
这个语法的意思是在页面的链接锚点进行搜索。
链接锚点指的是一个链接的描述文本,如这样的一段HTML代码:
a href=https://www.baidu.com百度/a,链接的锚点就是百度了。
我们搜索inanchor:YouTubeFacebook就可以搜索到有那些含有锚点的网页了,如下图所示。当然,这个语法也有一个变体allinanchor:,意思也与前面的类似。
4)site
这个语法是把搜索限制在站点域名之内。例如我们搜索site:google.com,结果如下图所示,这里我们通常不需要加上前面的www,这样搜索的结果就会是包括所有含有google.com域名的有关内容,包括顶级域名和二级域名甚至三级域名的内容。也就是说我们甚至可以通过搜索,确定google.com大概有多少个子域名!
5)inurl
inurl:会将搜索的范围限制在URL或者网站的页面上,这个语法对于查找搜索和帮助是很有用的,不仅适合我们普通的搜索,在黑客搜索中用处也很大。例如我们输入inurl:password,结果如下图所示,结果显示了所有URL中含有password的网页。另外,这个语法也有一个变体:allinurl:,用法与前面的相似。
注:site:google.com inurl:www.google.com的意义【查询谷歌有多少个子域名】
6)link
这个的功能是查询所有链接到某个特定URL上的列表。要注意的是,是特定的URL页面,如输入:link:www.baidu.com进行搜索,如下图所示,就会返回所有链接到百度主页的网页了。因此,我们同样可以指定特定的URL页面来进行搜索。
7)cache
Cache可以帮助我们查找到google索引过的页面副本,它最大的好处就是及时源文件界面不存在了,或者变成了其它的内容,我们依然可以搜索的到。例如输入:cache:www.baidu.b战com,结果如下所示,可以看到,格式虽然乱糟糟的,但是依稀可以从中获取一些有用的信息的。在国内的搜索引擎上,可能也有类似的功能,比如百度的网页快照,其功能与这个类似。
8)filetype
filetype是指搜索指定后缀的文件。这个不太常用,但是在黑客领域有一定的作用。但是我们的重点是讲解语法,如下图所示,输入filetype:mdb,结果就会显示出一些网站的数据库文件。
9)related
这个语法是用于搜索语某些页面相关的网站的,可以辅助我们搜索同类的页面。比如我们输入related:www.google.com,显示的结果都是一些其他的搜索引擎。
10)info
这个语法可以搜索到关于一个URL的更多信息的页面列表,这里的信息包括这个网页的cache,还有与这个网页相似的网页等等,注意下面的英文信息就好。输入info:www.baidu.com,结果如下图所示。