谷歌黑客搜索技巧(google hacking)

谷歌黑客搜索技巧(google hacking)

以下是针对关键词的限定。

· “A”=完全匹配

· A +B =包含所有关键词。

· A -B = 包含A但是不包含B。

· A OR B =包含其中一个关键词和都包含。

· “A” OR “B”

· (A OR B) –(A B)=(A –B) OR (B –A)=二选一。可惜我不会

以下是对关键词出现位置的限定。

· intitle:WORD =第一个关键词必须出现在标题里,第二个可以出现在任何位置.

· allintitle:WORD =所有关键词必须都出现在标题里.

· intext:Word=第一个关键词必须出现在文本中,第二个可以出现在任何位置。

· allintext:word =所有关键词必须出现在在文本中。

· inurl:WORD =第一个关键词必须出现在URL里,第二个可以出现在任何位置。

· allinurl:WORDS =所有关键词必须出现在URL中。

百度谷歌 intitle:搜索,把不受限两个关键词放前面更好看。

以下是对关键词文件类型的限定。

· filetype: = ext=指定文件类型.谷歌会扫描常见文档里的元数据,所以你的关键词可以是网页的任何地方关键词(标题,url,文本,锚文),信息检索 filetype:pdf,filetype不能单独使用。

· -filetype: = 剔除指定文件类型.除了常见的office文档还可以搜索任意文件扩展名结尾的网页。filfetype搜索文件其实是因为网页url中包含了url.pdf,url.doc,url.csv等,他是在url中查找。

  • site: 在特定网站中搜索.
  • -site:xxx.com屏蔽掉某网站

· index of=查找目录列表,”index of /”,要注意的是目录列表并不常见,所以不要太指望能查到自己想要的文件。你可以用filetype去查找。

intitle:”index of”=intitle:index.of=intitle:”index of /”, intitle:”index of /” name size缩小搜索范围。

查找特定目录的目录,要知道目录是存在url中的,那就好办了,如网站目录是Index of /stupid girl/借贷宝,输入intitle:index.of inurl: stupid girl,就可以访问stupid girl下的文件列表。

要知道index of是不存在与url中的,所以可以用intitle:index.of inurl: stupid girl –inurl:”index of”,但是可能会误杀,所以慎用。Stupid girl可能有很多但是借贷宝只有一个,所以借贷宝是特征词,搜索应该要搜索这些特征词,可以缩小搜索范围。

查找特定的文件用filetype或者inurlintitle:”index of” filetype:jpg

以下是2个操作符。

· ~WORD = 寻找此关键词和它的同义词

· ~WORD-WORD = 只搜索同义词,不要原词。

*=通配符。一个通配符只能代表一个词,而不是一个字母,凡在关键词首尾和没有是一样的。谷歌=*谷歌=谷歌*Google默认限制关键字最多32个单词,google baidu算两个词,空格不计算在内,中文很奇怪,以两个字组合为一个词只能搜30词,但"*"不占用字符限制位,活用*突破限制;

以下不常用的功能。

· info:URL = 查看网站信息。提供cache、link、related和完全包含该链接的网页的功能。

· related:URL =相关的网页.

· cache:URL =查看被删除的网页缓存.

· link:URL = 返回所有可链接到网页的网页清单,是可以点击的那种。可以是服务器名bilibili.com或完整的url,link:bilibili这样是错的,结果和link bilibili的结果一样,谷歌会把link和bilibili看做关键词来搜索,不能搜索关键词如中国.link搜索到的结果并不高亮关键词url,因为url并不真正的显示在网页中,它只是可以点击的。

· inanchor:word=与link相似,不同的是,它是在链接中搜索显示的文本,比如我们搜索inanchor:中华人民共和国中央人民政府,会得到带有『中华人民共和国中央人民政府』这个链接的网站,但是链接到哪里就不能确定了

· allinanchor

以下是逻辑运算符使用注意事项。

l 混合使用多种布尔操作时很容易搞混,记住只以从左到右的顺序执行而不是以高中所学的数学逻辑,左边管右边,右边的运算符在左边的管辖范围,以空格结束。另“()”对谷歌并没有用,是毫无作用。如:

intitle:谷歌 OR 百度 intitle:豆瓣 OR 知乎 OR 果壳 filetype:doc意思是

intitle:(谷歌 OR 百度) intitle:(豆瓣 OR 知乎 OR 果壳) filetype:doc谷歌解读为:把标题中带有谷歌或百度的网页提取出来,在取出来的网页中提取标题中带有豆瓣或知乎或果壳的网页,也就是:谷歌豆瓣,谷歌知乎,谷歌果壳,百度豆瓣,百度知乎,百度果壳,6种网页,在这些网页中只需要显示doc页面。

上面的两个检索式都是99条结果。下面检索式只有6条和5条和71条。

intitle:谷歌 OR intitle:百度 intitle:豆瓣 OR 知乎 OR 果壳 filetype:doc

intitle:谷歌 OR intitle:百度 intitle:豆瓣 OR intitle:知乎 OR intitle:果壳 filetype:doc

intitle:谷歌 OR 百度 intitle:豆瓣 OR intitle:知乎 OR intitle:果壳 filetype:doc改前面对结果影响太大。

intitle:"谷歌" 460000

intitle:"果壳" 446000

intitle:"谷歌" OR "果壳" 620000

intitle:"谷歌" OR intitle:"果壳" 487000(结果数目不同,但是前50页都一样)

l Allintitle,allinurl, info,link, cache,related ,define,不可以与其他操作符混合使用,allintext视情况而定allinanchor要放在首部如:allinanchor:中国 谷歌 site:edu,filetype可以。All开头的3个操作符一次搜索中只能使用一次,拱手应该避免使用all操作符。

l 默认使用AND逻辑搜索。

l 谨慎使用OR操作符。

l 问号,句号,逗号等无法成为关键字,加强制也不行。

l 对英文字符大小写不敏感。

l inurl:com和inurl:.com是不一样的。site:.com和site:com确实一样的。

l intitle:谷歌 ext:pdf OR ext:doc的结果略等于分别搜索pdf和doc的结果之和但是intitle:谷歌 ext:pdf OR doc的结果多了10倍以上,使用OR操作符的时候经常出现这种问题,应该避免略写。

l intitle:谷歌 ext:pdf –pdf按道理应该没有任何结果,因为pdf文件被pdf关键词所包含,但是实际情况却返回了60条结果,难道说谷歌只屏蔽掉标题,url,文本,锚文,而并没有屏蔽掉pdf文件扩展名。

l link:bilibili.com 谷歌(链接到哔哩哔哩的所有网页中搜索谷歌,这样的思路正确但是link不支持混合使用,谷歌会看成“link.bilibili.com 谷歌”来搜索)

l "+"强制搜索其后的一个单词,可以取消之前说的Google对常用单词的忽视(AND逻辑)

l 多个关键词,按照从左到右,权重降低,谷歌 百度和百度 谷歌是两个不同的结果。

混合使用:

site:bilibili.com -inurl:www

intitle:谷歌 (site:bilibili.com OR site:youku.com)

intitle:谷歌 (site:bilibili.com | site:youku.com)

intitle:谷歌 site:bilibili.com OR site:youku.com

inurl:bilibili intitle:谷歌

谷歌 inurl:huashengsheng.baijia.baidu.com(不受32词限制,因为没有空格所以是一个词)

Filetype:pdf inurl:信息检索 结果更少

谷歌 allinurl:h u n g s e b j a i d c o m r(结果0

intitle:谷歌 allinurl:bilibili(结果0

allinurl:bilibili intitle:谷歌(结果0

allinurl:bilibili com intitle:谷歌(结果0

link:bilibili.com -site:com(不是想要的结果,-site:com后结果反而变多了20万,很明显link不能混合使用,变成了” link:bilibili.com” –site:com

以下是自己的心得技巧。

l 根据网页特征选择查询词 很多类型的网页都有某种相似的特征。

l 选取特有的关键词,排除掉大众关键词的网页,缩小搜索结果,如想知道关于谷歌更多信息,搜索“拉里佩奇”。

l 把不需要的关键词记住,如果重复出现就屏蔽它。

l 随着关键词增多,搜索结果就越少。

l 关键词准则:无用信息输入,无用信息输出。

l 关键词的顺序不同,排序也不同,谷歌 百度;百度 谷歌。

l 图片搜索也可以用布尔运算符。

l OR 与 | 排序有一点点区别,比如加|一方有某个网页,而OR一方没有,所以排序并不是一模一样,使用的话统一用OR

l Intitle:谷歌 inurl:bilibili谷歌后面的空格是intitle操作符搜索的结尾。

l 不要使用太多布尔运算符把搜索范围限制太窄,得不偿失。如:intitle:谷歌 site:bilibili.com inurl:科技

l 关键词选择准确与否直接关系到搜索的成败,WTO”与“世界贸易组织”的搜索结果大向径庭等等。因此,必须注意对习惯用语、专业术语、全称、简称、同义词、近义词,以及拼音文字的前缀、后缀的了解和运用,尽可能地提高关键词的形式匹配几率,最大限度地减少误检和漏检。

l 主题关键词和特征关键词,例如,查找国际象棋有几个棋子, “国际象棋棋子”搜索,有42,600项结果,前几页结果均无明确的答案,而增加特征关键词“”,以“国际象棋个棋子”搜索,结果减少至1,270项,结果首页第一项即有“国际象棋共有32个棋子。“2004年国内十大新闻”;如果把查询词换成“2004年国内十大事件”,搜索结果就出来了。

l 选取关键词尽量简单且命中率高,[名人铃声] 的搜索效果可能要优于 [名人声音]。

l 输入更多的关键词来缩小范围,或者使用二次检索。

l 为了获得最佳结果,不要用自然语言,请使用最有可能出现在网页上的字词。例如,请输入“头痛”,而不是“我的头不舒服”。

l 看完一篇文章就记住它,下次点击网页就可以分辨是否重复,是否写的东西自己都知道了没必要再看了,心得文章有没有醍醐灌顶的感觉,好像发现新大陆一样。

l 正确选择关键词,需要对查询内容有一定了解,有一个根据搜索结果从模糊到准确的逐步调整关键词的练习过程。搜索的过程是一个学习和信息甄别的过程,要学会在搜索中选择和提炼关键词,丰富的搜索实践是成为搜索高手的必由之路。

以下是实例说明。全部是根据网页特征选择查询词。

例如,小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而页面上通常有“目录”两个字,点击页面上的链接,就进入具体的章节页,章节页的标题是小说章节名称; 软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词。等等。

经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。

例如,找明星的个人资料页。一般来说,明星资料页的标题,通常是明星的名字,而在页面上,会有“姓名”、“身高”等词语出现。比如找林青霞的个人资料,就可以用“林青霞 姓名 身高”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名 身高 intitle:林青霞”。这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是,您必须了解这种共性(或者通过试验性搜索预先发现共性)。

某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。 这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。 绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。 因此,最好的查询词,应该是“时间名言”。

用谷歌找问题的解决办法 例:浏览器主页 被修改

一部分人会把问题贴在网络上求助,而另一部分人,可能就会把问题解决办法发布在网络上。有了搜索引擎,我们就可以把这些信息找出来。

找这类信息,核心问题是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽量不要用自然语言,而是从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。

例如,我们上网时经常会遇到陷阱,浏览器默认主页被修改并锁定。这样一个问题的解决办法,我们应该怎样搜索呢?首先要确定的是,不要用自然语言。比如,有的人可能会这样搜索“我的浏览器主页被修改了,谁能帮帮我呀”。这是典型的自然语言。口语化的搜索词也可以给出适当的答案,但是这样的搜索常常得不到最想要的结果。我们来看这个问题中的核心词汇。对象:浏览器(或者IE)的主页。事件:被修改(锁定)。“浏览器”、“主页”和“被修改”,在这类信息中出现的概率会最大,IE可能会出现,至于锁定,用词比较专业化,不见得能出现。于是关键词中,至少应该出现“浏览器”、“主页”和“被修改”,这是问题现象描述。 一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。

利用谷歌找范文

A.找市场调查报告范文 例:市场 消费 需求 intitle:调查报告

市场调查报告的网页,有几个特点。第一是网页标题中通常会有“xxxx调查报告”的字样;第二是在正文中,通常会有几个特征词,如“市场”、“需求”、“消费”等。于是,利用intitle语法,就可以快速找到类似范文。

B.找申请书范文例:我志愿加入中国共产党 入党申请书

申请书有多种多样,常见的比如入党申请书。申请书有一定的格式,因此只要找到相应的特征词,问题也就迎刃而解。比如入党申请书的最明显的特征词就是“我志愿加入中国共产党”。

利用谷歌找谜底

例:眼皮上落着一只苍蝇 谜底

利用谷歌找医疗健康信息


A.根据已知疾病查找治疗方式 例:消除青春痘 例:预防口腔溃疡

这类资料通常有这样的特点,在标题中会注明疾病的名称,同时会有诸如“预防”、“治疗”、“消除”等特征性关键词。于是,用疾病名称和特征性关键词,就可以搜到相关的医疗信息。


B.找专业疾病网站 例:艾滋病

对于某些大型的综合类疾病,如心脏病、癌症、艾滋病等,我么也可以先用搜索引擎查找这类疾病的权威专业网站,然后到这些专业网站上求医问药,获取有关知识。找这类网站很简单,就是用疾病名称作关键词搜索。搜索引擎通常会把比较权威、质量比较高的网站列在前面。


C.根据症状找疾病隐患 例:经常打嗝 例:头皮屑特别多

我们经常还会有这样的需求,已知身体不舒服的症状,希望知道可能的疾病隐患是什么。这也可以通过搜索引擎解决问题。一般的疾病介绍资料,通常会有疾病名称、疾病症状、治疗方法等部分。我们描述的症状,如果和某个网页中的疾病症状刚好符合,搜到这样的网页,疾病名称也就知道了。做这类搜索的关键是,如何把症状现象用常用的表达方式提炼出来。

编辑于 2017-02-17