分类目录归档:google

百度的算法远不如谷歌

百度的算法远不如谷歌,不管你信不信,反正我信!一直都认为百度的算法不如GG, 只是没有现在这么强烈感概!!中国为什么就拒绝好东西关起大门来不思进取呢??

谷歌走了,搬到国外去了,迫着我们用百度,但越用百度,越气。百度搜索出来的结果,两个字:乱来!

在相关性及整站权重方面,百度优考虑整站权重,很多时候,不管你本站主题是否相关,更多的返回给你权重高的网站。

对于谷歌来说,他的算法就很好的处理了相关性跟整站权重问题,同样的搜索,GG的结果会让人更满意。

谷歌走了,夸张点说,中国的互联网倒退几年!

2010年Google算法更新记录,2011趋势

最近太忙了,也少去关注这些东西,转发下,留个记录

详细内容请看:2010年Google算法更新和2011年趋势展望

本文意在整理些重要的:
1.用户行为对排名的影响
2.2011.1.21  Matt Cutts发帖称Google即将上线针对低质量内容网站算法 1.26 google对“低质量抄袭内容”网站降权-2%。 搜索结果受影响

3。google确认网页打开速度影响排名
4。本地搜索占据更多搜索结果
5。因为垃圾链接惩罚大站

2011年SEOer关注什么:
怎样产生高质量原创内容
继续关注用户体验
怎样让用户谈论你

最近很少研究Google 的算法了,只要你是站在用户的角度来看问题,来下功夫,那么就不必去担心google是否给你排名,给你流量。

Google最近K站很利害啊

最近发现手里有几个站被K了,不同程度的,原因也各不相同。不过一个很重要的因素就是链接问题。

对同一个站不断地导出全站链接,最容易被惩罚。

如何发现站被惩罚呢:

1.快照,收录,PR 什么都没了。这种比较严重。

2.网站有更新,但快照不更新,新文章Google不收录。

3.登陆google管理员工具,被惩罚的站会收到一封信。

4.流量降为0,关键词排名消失。

几个被惩罚的站都是因为对同一个站导出几个全站链接。

还有一个站被惩罚了,因为服务器不稳定,内面排名都没了,PR也没了,流量丢失90%,做的站越多,让我越感觉网络太不安全了。随时都有跌得粉身碎骨的可能 。

不过呢,想想Google的做法也是对的,网络也需要种规则,没有这种规则这个游戏也玩不下去。

2009 Google AdSense 合作伙伴日精华视频

本来想去看一下的,但刚好那天还上班,又不好请假去。现在好了,刚收到Google的邮件,里面附带了一讲义和视频。

尊敬的 AdSense 发布商,

2009 Google AdSense 合作伙伴日在全国4大城市的活动已经于7月底圆满结束。作为史上最大规模的路演活动,本次会议的内容精彩纷呈,得到了参会发布商的热烈反响,同时收益上也得到显著提升。

为了将活动的成果跟更多发布商 分享,帮助大家占领先机,加速发展,我们现将活动6大主题演讲的完整讲义和7段演讲视频放到活动的官方网站上,供大家参阅。

主题一–Google多媒体广告策略与发展
主题二–Google广告匹配原理
主题三–Google自定义搜索指南
主题四–重点产品更新与新功能说明
主题五–Google广告管理系统介绍
主题六–AdSense 广告政策官方说明


希望这些精华资讯可以帮助您提升收益,开拓视野,谋求更大的事业发展空间!

如何确保Google Adsense安全和避免被封

网上关于Google Adsense的资料很多,下面的这些问与答参加Google Adsense伙伴合作日心得分享,转载过来,大家也看看。

1、什么情况下会封账号?

违法google Adsense政策的网站,常见的情况如下:

a、广告设置带诱惑性,比如”请帮我点点广告,但不要多点”、”精彩内容”等等,官方认可的只有”赞助商广告”、”google Adsense广告”字样。

b、涉及版权问题,比如全站采集抄袭别人的内容,以及视频音乐软件下载

c、整页充斥广告,使得浏览者必须点击

d、作弊无效点击

2、我的账号被封了,以前的余额是否可以取出?

这个问题太多人问了。答案是:不可以。一旦账号被封,所有款项不能取出,将退给广告赞助商。

3、一旦账号被停,应该如何处理?

在账号停止之前,google adsense会发一封警告邮件,请在收到该邮件的48小时内回复并给于合理解释,否则48小时候将停止帐户。

4、为什么我没有收到警告邮件帐户就被k了?

因为你已经明确违法了google Adsense的广告政策,比如版权问题等,所以不再警告,警告的一般是无效点击过多,有作弊嫌疑,还存在解释的空间或者可以更正的问题。

5、在中国地区,会考虑用人民币支付吗?

暂时没有考虑。

6、google Adsense与其他广告联盟,如百度主题推广,是否存在冲突?

肯定没有。

7、如果一些垃圾站,直接采集复制了我网站的内容而盈利,应该怎么办?

向google Adsense投诉,并提供相关证据,比如相关网址和截图。

Google出问题,影响了多少人

今天早上起来发现用国内的IP还是访问不了,看腾讯新闻上说已经恢复. 看来没这么快.

现在用国外的IP是可以上的. 下面是网络上流传的原因: Google国际网站遭到域名劫持

今天晚上,包括Google.com在内的绝大多数Google国际网站,例如Google.com、Gmail、Google Reader、Google Docs等,在中国部分省市均出现无法访问的情况。

根据我的分析,这次封锁Google的方式并不新鲜,是采用域名劫持(DNS劫持)的方法,通过技术手段,将Google的各类境外域名解析到一个错误的地址,使得Google.com无法访问。前段时间,中央电视台曾经在多个栏目中指责Google,并要求其关闭境外网站搜索功能。

经过我的测试,使用中国大陆境内的DNS服务器,例如202.96.134.133是无法正确解析出Google的IP地址,而使用境外的OpenDNS进行域名解析,就可以正确解析出Google的IP地址。

解决的方法是使用境外的域名解析服务器(DNS服务器),例如OpenDNS的服务,设置方法是,在”设置”-“网络连接”中找到宽带上网的连接,打开网络连接属性,选择Interner协议(TCP/IP)的属性页里,不要选择自动获取DNS,而要选择”使用下面的DNS服务器地址”,首选DNS服务器和备用DNS服务器分别设置为208.67.222.222和208.67.220.220,如下图所示,完成后重新连接上网,就可以摆脱服务商对我们的DNS劫持。

最后,我强烈谴责这种对于Google网站进行域名劫持的无耻行为。

名词解释(来源于维基百科):

DNS是域名系统 (Domain Name Server) 的缩写,该系统用于命名组织到域层次结构中的计算机和网络服务。在Internet上域名与IP地址之间是一对一(或者一对多)的,域名虽然便于人们记忆,但机器之间只能互相认识IP地址,它们之间的转换工作称为域名解析,域名解析需要由专门的域名解析服务器来完成,DNS就是进行域名解析的服务器。

域名解析的基本原理是把域名翻译成IP地址,以便计算机能够进一步通信,传递网址和内容等。

域名劫持就是在劫持的网络范围内拦截域名解析的请求,分析请求的域名,把审查范围以外的请求放行,否则直接返回假的IP地址或者什么也不做使得请求失去响应,其效果就是对特定的网址不能访问或访问的是假网址。

本报讯 (记者彭梧)昨夜21时左右,包括Gmail在内的多项谷歌国际域名(www.google.com)下的服务遭遇”闪断”,多项服务不能正常使用连接。但中国域名(www.google.cn)下的服务则全部正常。至23时20分左右,”罢工”两小时的多项服务陆续恢复,但仍有部分地区用户无法正常使用。

据中立第三方调查机构数据显示,截至2008年底,Google旗下的邮件服务Gmail在中国大约拥有10%左右的市场占有率,影响2000万左右的中国用户。

谷歌中国官方昨天晚间未能就此事提供回应,但未否认”部分服务暂时无法使用”的情况。有知情人士表示,今年早些时候谷歌也曾经遭遇过同样的问题,但在不到两天之后即全面恢复。

当时谷歌给出的官方答复语焉不详,并未完整交代”国际服务罢工”的具体原因,只在最后表示”通过和有关部门的协调,问题最终已解决”。

大约一周前,中国互联网举报中心对谷歌在检索结果中提供大量淫秽色情信息表示”强烈谴责”,谷歌官方随后表态称,立即全力整改旗下服务,并暂时关停国际网页搜索和联想词检索服务。

焦点访谈在给Google做广告?

看了今天的焦点访谈就知道什么了,焦点访谈曝光谷歌传播色情和低俗信息,点石上讨论得很热闹. 但我看到的更多声音是,为Google抱不平.

作为站长, 我一向偏爱Google, 人家技术先进, 以致于犯下这个错误.

我也在想, CCTV不是在教人怎么搜索色情和低俗信息吗? 我天天用Google, 却还不知道可以用这方法去搜索这种信息.或者我真的落后.

在央视记者的教导下 我学会了怎么在google.com上面搜索色情

想想,Google今天的流量肯定暴涨。

Google虽然有不对之处,但色情和低俗信息也不是它生产的啊.它不也只量索引网上的信息吗?

接下来会发生什么呢? 大家拭目以待吧!

Google搜索指令大全

网上看到了这篇文章,Google搜索指令大全,应用得好,对找一些英文站的链接资源是非常有帮助的:

google的秘密入口

一.大家试过没有,使用google,如果加用了超级代理,会有多十倍的东东可搜…

二.下面是google的一些秘密入口

http://www.google.com/microsoft

微软风格的入口

http://www.google.com/mac

MAC风格的入口

http://www.google.com/linux

Linux风格的入口

http://www.google.com/bsd

FreeBSD风格的入口

Google有各种语言的版本,下面这些语言可能实在是稀罕了点儿

http://www.google.com/intl/xx-klingon/

克林语入口(没看过星际旅行吗?)

http://www.google.com/intl/xx-bork/

zz入口

http://www.google.com/intl/xx-elmer/

宗教入口

http://www.google.com/intl/xx-piglatin/

小猪入口

http://www.google.com/intl/xx-hacker/

黑客专用入口

Google里还有一个小小的彩蛋游戏,大家自己去看吧!

http://www.google.com/Easter/feature_easter.html

下面是一此更有用的彩蛋

http://froogle.google.com/

作用: 通过特殊的搜索引擎,你可以在网上找到你想购物的网站位置。以及你可以很方便的搜索出同类产品的价格。

看看世界各地的商品价格,自己再买的时候心底有数多了把

http://labs.google.com/gviewer.html

作用:一个小玩具,适合那些连鼠标都懒得动的懒人。当你在google上找到了查询结果后,你可以使用google viewer让结果以自己定义的间隔时间来一条一条自动滚屏。

http://labs.google.com/cgi-bin/webquotes

作用:可以搜索出你要查询的内容在internet上被多少其他的网站引用过,可以让你知道internet上其他人对你要查询内容的观点,适合写论文和评论以及特殊用途人使用。

http://labs.google.com/glossary

作用:顾名思义了,就是一个查英语缩写语意的工具,google的词汇表

http://labs1.google.com/gvs.html

作用:给google打一个电话,说出你要查找的内容,然后google会把你要查询的结果显示出来。 给不识字的人用的

Google让你突破下载

搜索Google大家都用过吧?我们正是利用它强劲的搜索功能来突破封锁下载,Google搜索和限制下载有什么关系,没可能实现吧?不要不相信哦,往下看哦!

首先打开Google,在关键词输入框中输入””index of/”inurl:lib”,选择”搜索简体中文网页”选项,回车搜索,得到了一些网页,不要以为这是一些普通的页面,其实它们是一些图书网站的资源列表,点击打开它来看看,怎么样?是不是所有资源一收眼底了?

使用其他关键字可能得到更多的资源:

在搜索框上输入:””index of /”cnki”

再按搜索你就可以找到许多图书馆的CNKI、VIP、超星等入口!

在搜索框上输入:””index of /” ppt”

再按搜索你就可以突破网站入口下载powerpint作品!

在搜索框上输入:””index of /”mp3″

再按搜索你就可以突破网站入口下载mp3、rm等影视作品!

在搜索框上输入:””index of /”swf ”

再按搜索你就可以突破网站入口下载flash作品!

在搜索框上输入:””index of /””加上要下载的软件名

再按搜索你就可以突破网站入口下载软件!

在搜索框上输入:””index of /”AVI”

再按搜索你就可以突破网站入口下载AVI视频

到这里,大家也许都明白了,其实就是””index of /””这个关键词在起的作用,使用它可以直接进入网站首页下的所有文件和文件夹中,不必在通过HTTP的网页形式了,从而避免了那些网站的限制,作到了突破限制下载。
作者: kenny658
——————————————————————————–

其实早应该发出来的,国内关于google技巧方面的整理,我大概算是最早一批人吧,后来sniper都写了google hack,就更懒的发了。如今帮老婆找论文,关键字匹配累的要死。这些技巧是我整理以后淘汰的后的,最好的那些如有兴趣可以找我直接索取

<-!-page–>

Http://www.feelids.com
By swap

站内搜索地址为:

http://www.google.com/custom?domains=(这里写我们要搜索的站点,比如feelids.com)

进去可以选择www和feelids.com, 当然再选我们要的站内搜索哦!

黑客专用信息和资料搜索地址为:

http://www.google.com/custom?hl=xx-hacker

这里是google关键字的用法,要设置它为中文,则是

http://www.google.com/custom?hl=zh-CN

英文则是http://www.google.com/custom?hl=en

常用的google关键字:
foo1 foo2 (也就是关联,比如搜索xx公司 xx美女)
operator:foo
filetype:123 类型
site:foo.com 相对直接看网站更有意思,可以得到许多意外的信息
intext:foo
intitle: fooltitle 标题哦
allinurl:foo 搜索xx网站的所有相关连接。(踩点必备)
links:foo 不要说就知道是它的相关链接
allintilte:foo.com

我们可以辅助”-” “+”来调整搜索的精确程度

直接搜索密码:(引号表示为精确搜索)
当然我们可以再延伸到上面的结果里进行二次搜索
“index of” htpasswd / passwd
filetype:xls username password email
“ws_ftp.log”
“config.php”
allinurl:admin mdb
service filetype:pwd ….或者某个比如pcanywhere的密码后缀cif等

越来越有意思了,再来点更敏感信息
“robots.txt” “Disallow:” filetype:txt
inurl:_vti_cnf (FrontPage的关键索引啦,扫描器的CGI库一般都有地)
allinurl: /msadc/Samples/selector/showcode.asp
/../../../passwd
/examples/jsp/snp/snoop.jsp
phpsysinfo
intitle:index of /admin
intitle:”documetation”
inurl: 5800(vnc的端口)或者desktop port等多个关键字检索
webmin port 10000
inurl:/admin/login.asp
intext:Powered by GBook365
intitle:”php shell*” “Enable stderr” filetype:php 直接搜索到phpwebshell

foo.org filetype:inc

ipsec filetype:conf
intilte:”error occurred” ODBC request WHERE (select|insert) 说白了就是说,可以直接试着查查数据库检索,针对目前流行的sql注射,会发达哦
intitle:”php shell*” “Enable stderr” filetype:php
“Dumping data for table” username password
intitle:”Error using Hypernews”
“Server Software”
intitle:”HTTP_USER_AGENT=Googlebot”
“HTTP_USER_ANGET=Googlebot” THS ADMIN
filetype:.doc site:.mil classified 直接搜索军方相关word

检查多个关键字:
intitle:config confixx login password

“mydomain.com” nessus report
“report generated by”
“ipconfig”
“winipconfig”

google缓存利用(hoho,最有影响力的东西)推荐大家搜索时候多”选搜索所有网站”
特别推荐:administrator users 等相关的东西,比如名字,生日等……最惨也可以拿来做字典嘛
cache:foo.com

可以查阅类似结果

先找找网站的管理后台地址:
site:xxxx.com intext:管理
site:xxxx.com inurl:login
site:xxxx.com intitle:管理
site:a2.xxxx.com inurl:file
site:a3.xxxx.com inurl:load
site:a2.xxxx.com intext:ftp://*:*
site:a2.xxxx.com filetype:asp
site:xxxx.com //得到N个二级域名
site:xxxx.com intext:*@xxxx.com //得到N个邮件地址,还有邮箱的主人的名字什么的
site:xxxx.com intext:电话 //N个电话
intitle:”index of” etc
intitle:”Index of” .sh_history
intitle:”Index of” .bash_history
intitle:”index of” passwd
intitle:”index of” people.lst
intitle:”index of” pwd.db
intitle:”index of” etc/shadow
intitle:”index of” spwd
intitle:”index of” master.passwd
intitle:”index of” htpasswd
“# -FrontPage-” inurl:service.pwd

allinurl:bbs data
filetype:mdb inurl:database
filetype:inc conn
inurl:data filetype:mdb
intitle:”index of” data

一些技巧集合:

3) “http://*:*@www” domainname 找一些ISP站点,可以查对方ip的虚拟主机
3
4) auth_user_file.txt 不实用了,太老了

5) The Master List 寻找邮件列表的

6) intitle:”welcome.to.squeezebox” 一种特殊的管理系统,默认开放端口90
7) passlist.txt (a better way) 字典

8) “A syntax error has occurred” filetype:ihtml

9) ext:php program_listing intitle:MythWeb.Program.Listing
10) intitle:index.of abyss.conf
11)ext:nbe nbe

12)intitle:”SWW link” “Please wait…..”
13)

14) intitle:”Freifunk.Net – Status” -site:commando.de

15) intitle:”WorldClient” intext:”? (2003|2004) Alt-N Technologies.”

17) intitle:open-xchange inurl:login.pl

20) intitle:”site administration: please log in” “site designed by emarketsouth”
21) ORA-00921: unexpected end of SQL command

22)intitle:”YALA: Yet Another LDAP Administrator”
23)welcome.to phpqladmin “Please login” -cvsweb
24)intitle:”SWW link” “Please wait…..”
25)inurl:”port_255″ -htm

27)intitle:”WorldClient” intext:”? (2003|2004) Alt-N Technologies.”

这些是新的一些漏洞技巧,在0days公告公布

ext:php program_listing intitle:MythWeb.Program.Listing

inurl:preferences.ini “[emule]”

intitle:”Index of /CFIDE/” administrator

“access denied for user” “using password”

ext:php intext:”Powered by phpNewMan Version” 可以看到:path/to/news/browse.php?clang=../../../../../../file/i/want

inurl:”/becommunity/community/index.php?pageurl=”

intitle:”ASP FileMan” Resend -site:iisworks.com

“Enter ip” inurl:”php-ping.php”

ext:conf inurl:rsyncd.conf -cvs -man

intitle: private, protected, secret, secure, winnt

intitle:”DocuShare” inurl:”docushare/dsweb/” -faq -gov -edu
“#mysql dump” filetype:sql

“allow_call_time_pass_reference” “PATH_INFO”

“Certificate Practice Statement” inurl:(PDF | DOC)

LeapFTP intitle:”index.of./” sites.ini modified
master.passwd

mysql history files
NickServ registration passwords
passlist
passlist.txt (a better way)
passwd
passwd / etc (reliable)
people.lst
psyBNC config files
pwd.db
signin filetype:url
spwd.db / passwd
trillian.ini
wwwboard WebAdmin inurl:passwd.txt wwwboard|webadmin

“# -FrontPage-” ext:pwd inurl:(service | authors | administrators | users) “# -FrontPage-”

inurl:service.pwd
“AutoCreate=TRUE password=*”
“http://*:*@www” domainname
“index of/” “ws_ftp.ini” “parent directory”
“liveice configuration file” ext:cfg -site:sourceforge.net
“powered by ducalendar” -site:duware.com
“Powered by Duclassified” -site:duware.com
“Powered by Duclassified” -site:duware.com “DUware All Rights reserved”
“powered by duclassmate” -site:duware.com
“Powered by Dudirectory” -site:duware.com
“powered by dudownload” -site:duware.com
“Powered By Elite Forum Version *.*”
“Powered by Link Department”
“sets mode: +k”
“Powered by DUpaypal” -site:duware.com
allinurl: admin mdb
auth_user_file.txt
config.php
eggdrop filetype:user user
etc (index.of)
ext:ini eudora.ini
ext:ini Version=… password
ext:txt inurl:unattend.txt

filetype:bak inurl:”htaccess|passwd|shadow|htusers”

filetype:cfg mrtg “target[*]” -sample -cvs -example

filetype:cfm “cfapplication name” password

filetype:conf oekakibbs
filetype:conf sc_serv.conf

filetype:conf slapd.conf

filetype:config config intext:appSettings “User ID”

filetype:dat “password.dat”

filetype:dat wand.dat

filetype:inc dbconn

filetype:inc intext:mysql_connect
filetype:inc mysql_connect OR mysql_pconnect

filetype:inf sysprep

filetype:ini inurl:”serv-u.ini”
filetype:ini inurl:flashFXP.ini
filetype:ini ServUDaemon
filetype:ini wcx_ftp
filetype:ini ws_ftp pwd

filetype:ldb admin

filetype:log “See `ipsec copyright”

filetype:log inurl:”password.log”

filetype:mdb inurl:users.mdb

filetype:mdb wwforum

filetype:netrc password

filetype:pass pass intext:userid

filetype:pem intext:private

filetype:properties inurl:db intext:password

filetype:pwd service
filetype:pwl pwl

filetype:reg reg +intext:”defaultusername” +intext:”defaultpassword”
filetype:reg reg HKEY_CURRENT_USER SSHHOSTKEYS
filetype:sql (“values * MD” | “values * password” | “values * encrypt”)
filetype:sql (“passwd values” | “password values” | “pass values” )
filetype:sql +”IDENTIFIED BY” -cvs
filetype:sql password

filetype:url +inurl:”ftp://” +inurl:”;@”

filetype:xls username password email

htpasswd
htpasswd / htgroup
htpasswd / htpasswd.bak

intext:”enable secret $”
intext:”powered by Web Wiz Journal”

intitle:”index of” intext:connect.inc
intitle:”index of” intext:globals.inc
intitle:”Index of” passwords modified

intitle:dupics inurl:(add.asp | default.asp | view.asp | voting.asp) -site:duware.com
—————————————-

intitle:index.of intext:”secring.skr”|”secring.pgp”|”secring.bak”

inurl:”GRC.DAT” intext:”password”

inurl:”slapd.conf” intext:”credentials” -manpage -“Manual Page” -man: -sample

inurl:”slapd.conf” intext:”rootpw” -manpage -“Manual Page” -man: -sample

inurl:”wvdial.conf” intext:”password”

inurl:/db/main.mdb

inurl:chap-secrets -cvs

inurl:config.php dbuname dbpass
inurl:filezilla.xml -cvs

inurl:lilo.conf filetype:conf password -tatercounter -bootpwd -man

inurl:nuke filetype:sql

inurl:ospfd.conf intext:password -sample -test -tutorial -download 路由配置
inurl:pap-secrets -cvs

inurl:perform filetype:ini
inurl:secring ext:skr | ext:pgp | ext:bak

inurl:vtund.conf intext:pass -cvs

inurl:zebra.conf intext:password -sample -test -tutorial -download

“Generated by phpSystem”
“generated by wwwstat”

“Host Vulnerability Summary Report” ]

“HTTP_FROM=googlebot” googlebot.com “Server_Software=”

“Index of” / “chat/logs” 聊天室
“Installed Objects Scanner” inurl:default.asp

“Mecury Version” “Infastructure Group”
“Microsoft (R) Windows * ™ Version * DrWtsn Copyright (C)” ext:log

“Most Submitted Forms and Scripts” “this section”

“Network Vulnerability Assessment Report”

“not for distribution” confidential
“phone * * *” “address *” “e-mail” intitle:”curriculum vitae”

“phpMyAdmin” “running on” inurl:”main.php”

“produced by getstats”
“Request Details” “Control Tree” “Server Variables”
“robots.txt” “Disallow:” filetype:txt

“Running in Child mode”

“sets mode: +p”
“sets mode: +s”
“Thank you for your order” +receipt
“This is a Shareaza Node”
“This report was generated by WebLog”
( filetype:mail | filetype:eml | filetype:mbox | filetype:mbx ) intext:password|subject

(inurl:”robot.txt” | inurl:”robots.txt” ) intext:disallow filetype:txt

-site:php.net -“The PHP Group” inurl:source inurl:url ext:pHp

FBR “ADOBE PHOTOSHOP”
AIM buddy lists
allinurl:/examples/jsp/snp/snoop.jsp
allinurl:servlet/SnoopServlet
cgiirc.conf

data filetype:mdb -site:gov -site:mil

exported email addresses

ext:asp inurl:pathto.asp

ext:cgi inurl:editcgi.cgi inurl:file=

ext:conf inurl:rsyncd.conf -cvs -man
ext:conf NoCatAuth -cvs

ext:dat bpk.dat
ext:gho gho

ext:ini intext:env.ini
ext:ldif ldif

ext:log “Software: Microsoft Internet Information Services *.*”
——————————
ext:mdb inurl:*.mdb inurl:fpdb shop.mdb

filetype:bkf bkf
filetype:blt “buddylist”
filetype:blt blt +intext:screenname

filetype:cfg auto_inst.cfg

filetype:conf inurl:firewall -intitle:cvs
filetype:config web.config -CVS

filetype:ctt ctt messenger

filetype:fp fp
filetype:fp fp -site:gov -site:mil -“cvs log”

filetype:inf inurl:capolicy.inf
filetype:lic lic intext:key

filetype:myd myd -CVS
filetype:ns ns
filetype:ora ora
filetype:ora tnsnames
filetype:pdb pdb backup (Pilot | Pluckerdb)

filetype:pot inurl:john.pot
————————————–
filetype:pst inurl:”outlook.pst”
filetype:pst pst -from -to -date
filetype:qbb qbb
filetype:rdp rdp

filetype:reg “Terminal Server Client”
filetype:vcs vcs
filetype:wab wab

filetype:xls -site:gov inurl:contact
filetype:xls inurl:”email.xls”
Financial spreadsheets: finance.xls
Financial spreadsheets: finances.xls

Ganglia Cluster Reports

haccess.ctl (one way)
haccess.ctl (VERY reliable)
ICQ chat logs, please…

iletype:log cron.log
intext:”Session Start * * * *:*:* *” filetype:log
intext:”Tobias Oetiker” “traffic analysis”

intext:(password | passcode) intext:(username | userid | user) filetype:csv
intext:gmail invite intext:http://gmail.google.com/gmail/a

intext:SQLiteManager inurl:main.php

intitle:”Apache::Status” (inurl:server-status | inurl:status.html | inurl:apache.html)

intitle:”AppServ Open Project” -site:www.appservnetwork.com
intitle:”ASP Stats Generator *.*” “ASP Stats Generator” “- weppos”

intitle:”FTP root at”
intitle:”index of” +myd size

intitle:”Index Of” -inurl:maillog maillog size

intitle:”Index Of” cookies.txt size

intitle:”index of” mysql.conf OR mysql_config
intitle:”Index of” upload size parent directory

intitle:”index.of” .diz .nfo last modified
intitle:”Multimon UPS status page”
intitle:”PHP Advanced Transfer” (inurl:index.php | inurl:showrecent.php )
intitle:”PhpMyExplorer” inurl:”index.php” -cvs
———————–
intitle:”statistics of” “advanced web statistics”
intitle:”System Statistics” +”System and Network Information Center”
intitle:”Usage Statistics for” “Generated by Webalizer”
intitle:”wbem” compaq login “Compaq Information Technologies Group”

intitle:”Web Server Statistics for ****”
intitle:”web server status” SSH Telnet
intitle:”welcome.to.squeezebox”

intitle:admin intitle:login
intitle:index.of “Apache” “server at”
intitle:index.of cleanup.log
intitle:index.of dead.letter
intitle:index.of inbox
intitle:index.of inbox dbx

intitle:intranet inurl:intranet +intext:”phone”
inurl:”/axs/ax-admin.pl” -script
inurl:”/cricket/grapher.cgi”
inurl:”bookmark.htm”

inurl:”cacti” +inurl:”graph_view.php” +”Settings Tree View” -cvs -RPM
inurl:”newsletter/admin/”
inurl:”newsletter/admin/” intitle:”newsletter admin”
inurl:”putty.reg”
inurl:”smb.conf” intext:”workgroup” filetype:conf conf
————————————

Welcome to ntop!

“adding new user” inurl:addnewuser -“there are no domains”
(inurl:/cgi-bin/.cobalt/) | (intext:”Welcome to the Cobalt RaQ”)

filetype:php HAXPLORER “Server Files Browser”
intitle:”Web Data Administrator – Login”

inurl:ConnectComputer/precheck.htm | inurl:Remote/logon.aspx
PHP Shell (unprotected)
PHPKonsole PHPShell filetype:php -echo
Public PHP FileManagers

“index of” / picasa.ini
“index of” inurl:recycler
“Index of” rar r nfo Modified
“intitle:Index.Of /” stats merchant cgi-* etc
“Powered by Invision Power File Manager” (inurl:login.php) | (intitle:”Browsing directory /” )
“Web File Browser” “Use regular expression”

filetype:ini Desktop.ini intext:mydocs.dll

intext:”d.aspx?id” || inurl:”d.aspx?id”
intext:”Powered By: TotalIndex” intitle:”TotalIndex”
intitle:”album permissions” “Users who can modify photos” “EVERYBODY”
intitle:”Directory Listing For” intext:Tomcat -intitle:Tomcat
intitle:”HFS /” +”HttpFileServer”
intitle:”Index of *” inurl:”my shared folder” size modified
—————————————

“File Upload Manager v.” “rename to”

ext:asp “powered by DUForum” inurl:(messages|details|login|default|register) -site:duware.com
ext:asp inurl:DUgallery intitle:”.” -site:dugallery.com -site:duware.com
ext:cgi inurl:ubb_test

ezBOO “Administrator Panel” -cvs

filetype:cgi inurl:cachemgr.cgi
filetype:cnf my.cnf -cvs -example
filetype:inc inc intext:setcookie

filetype:php inurl:”viewfile” -“index.php” -“idfil
filetype:wsdl wsdl

intitle:”ASP FileMan” Resend -site:iisworks.com

intitle:”Index of /” modified php.exe

intitle:”phpremoteview” filetype:php “Name, Size, Type, Modify”

inurl:” WWWADMIN.PL” intitle:”wwwadmin”
inurl:”nph-proxy.cgi” “Start browsing through this CGI-based proxy”
inurl:”plog/register.php”
inurl:cgi.asx?StoreID

inurl:robpoll.cgi filetype:cgi

The Master List

“More Info about MetaCart Free”

MattCutts:关于影响排名的语录

ZoundryDocument为什么我的pr没动、为什么我的pr降了、为什么我的pr始终到不了6 或者 7、8…

废话不多说,下面这张图清晰的告诉你为什么你的网站到不了6 、7 、8….

PR的提高是一个金字塔式的过程 越往上越难!

另外不要把PR的重要性看的过高,我们正在努力减少PR对排名的影响!

Googel PR值

PS:这次我注意到点石论坛这次有几个站的pr从0升到6  表现不错!

SEO人脉很重要!

记得上次PageRank刚刚更新后我来贵论坛的时候碰到有朋友问下次PR更新在什么时候,我当时在下面这个帖子的二楼做了回复(详见:http://www.dunsh.org/forums/thread-43047-1-82.html),这次我们之所以选择了在美国中部时间2009年4月1日更新PR是和上次新年一样,同样是在节日里增添更多的乐趣,只不过这次变成了愚人节!

看到这里有人会说那么PR更新是不是就是以3个月为一个周期呢?
是的!总体上来说我们会以100天为一个基准进行PageRank的调整,但是具体到哪一天则要看我本人的心情,如果到了3个月或者100天改更新PR的时候而我们没有更新的时候,请不要着急看看近期是不是有什么节日,节日当天可能会有意外的惊喜哦!

1. 只要你提供对用户有帮助的内容,而这些内容又可以被蜘蛛顺利抓取,正常情况下,就已经解决了大部分问题。

2. 我们给bold的权重比strong稍高一点,但差别很小,不用在这方面想太多。(但后来更正为权重一样)。对两种斜体em和i两种标签的权重比也完全一样。

3. 不用担忧很多网站共享同一个IP地址,放在同一架服务器上,对排名完全没有影响。

4. 上百万个网页同时上线,不一定有问题,但绝大部分情况下这都是够可疑的。所以他建议,你要真有这么多网页,最好尝试软性逐渐发布,几千页几千页的上线,可能会好一点5. 如果不做搜索引擎优化,用户找不着你。

6. Google内部有很多垃圾检测工具。(Kyw的理解:别傻乎乎的用所谓的SEO软件,有规律的作弊总能被检查出来。)

7. 建议大家可以用Yahoo Site Explorer查一下网站的反向链接

8. 不会担心是否符合符合W3C标准,因为40%的网页都有编码错误,搜索引擎不会因为网页上有错误而抛弃40%的网站内容。

9. 静态和动态URL处理的方式是类似的,但不要在动态URL中使用太多参数,最多用两三个。同时不要用太长的数字,因为那可能会与Session ID混淆。最好能够用mod_rewrite进行URL改写,把动态URL改为静态URL。

10. 根据用户IP返回不同内容,不会被认为是隐藏网页(cloaking)。但如果给予Google蜘蛛特殊的对待,就会被当作隐藏网页。

11. 栏目中出现关键词不是重要,重要的是网站的确应该根据不同的话题来分成不同的目录,形成一个树型结构。至于目录名用什么就无关紧要了,重要的是在不同的目录下话题是紧密相关的。这样在各个目录下自然会包含关键词。

12. Google内部有专门的补充材料小组在研究和观察,主Google蜘蛛和补充材料蜘蛛是分开的。当下一次补充材料蜘蛛来访你的网页的时候,如果看到了301转向或者质量的提高,自然网页会回到主索引库。

13. 就Matt Cutts所知GOOGLE没有用Google Analytics(GG提供的流量统计工具)收集数据。

14. 有各种不同的复制内容,比如说完全一样的网页,也有的是近乎复制的网页,我们有很多非常复杂的逻辑来进行检测。如果你觉得你可能有复制内容网页的问题,那就要确保你的网页之间全都不同。

15. 不建议下拉菜单中放入链接,这也不是标准的制作手法。他建议还是把链接放在网页底部或网站地图上。

16. 在Google进行算法更新的时候,或者测试新的功能的时候,都在一个数据中心先进行,确认质量达到我们的期望。完全不必要去观察不同数据中心返回的搜索结果。

17. 如果你的网页有差不多相同的内容,那么尽量使它们看起来不同。

18. 一般来说如果内容差不多,Google就会自行判断,然后选出一个他们认为最好的。如果你想避免复制网页的产生,可以试着确保网站的模板非常非常不一样。

19. 以前曾经有人问gov和edu域名的链接是不是比普通域名的权重要高?实际上我们并不会看这个链接来自开放目录,或者来自gov或edu域名,就给它特殊的对待。只是这些网站一般都有比较高的PR值,有更多的网站链接向他们。

20. 博客和普通网站在排名算法方面没有什么区别,除非你做的是博客搜索(blog search)。

21. 在你看到toolbar中的新PR的时候,这些数值已经被考虑在排名算法当中了。所以你可能看着新的PR值很高兴,但是它并不是导致排名结果变化的原因。所以你不会看到因为PR更新导致排名结果的变化,这些排名结果的变化,已经从上一次PR更新就开始计算了。

22. Matt Cutts在回答一个帖子的时候曾经说过:有补充材料现在不一定是件坏事。你的这个情况在我看来,只是缺少PR和链接的一个反映。你的首页已经在我们的主 数据库中,但是你并没有多少链接。所以我认为你的网站并没有什么问题,只不过我们的索引数据库只能选择一部分文件,如果有更多的人链接到你的网站,我预期你的网页会回到主数据库。

为什么我的pr没动、为什么我的pr降了、为什么我的pr始终到不了6 或者 7、8…

废话不多说,下面这张图清晰的告诉你为什么你的网站到不了6 、7 、8….

PR的提高是一个金字塔式的过程 越往上越难!

另外不要把PR的重要性看的过高,我们正在努力减少PR对排名的影响!

Googel PR值

解读影响排名的因素

直接看2009的,看来Google的算法越来越看重网站域名的权重。

在点石上有人这么问:这个trust / authority 不知道怎么去衡量?

我说说个人看法:
1.网站的权重=链接质量+链接数量+网站内容(用户体验度)+时间
链接质量与以下相关:
  • 锚文字(特别是和查询语句相匹配时,能起到非常大的积极作用)
  • 网页中的位置(这个MSN搜索 也许可以说明它是怎么影响排名的)
  • 链接的PageRank(PageRank越高越好)
  • 链接的域名信任度(越高越好)
  • Html中的链接(图片链接、Javascript链接、标准的a href链接等)。虽然有些Javascript链接也能被识别,但是权重会大打折扣;图片的链接也在某种程度上比标准的链接差。
  • 链接的时效性(个链接能持续多长时间,等)。决定了这个链接能传递多少权重,还可能会被用来判断是否购买链接
  • Nofollow的使用
  • 网页和链接指向网页的内容相关性(越相关越好)
  • 网站和链接所指向页面内容相关性(越相关越好)
  • 链接周围的文本(和上面二者一样)
  • 过去的链接关系(如果网页/站点以前曾经链接过目标网页/站点,则权重会降低;这个也有可能会被用来判断是否互惠链接)
  • 服务器(如果是同一IP或者同一C段IP地址下不同域名,链接权重将会降低)
  • 域名注册信息(如果域名有相同的注册信息,链接权重将会降低)

链接数量

链接广度,我的理解是:1000来自不同IP即不同网站的外链作用大于10000来自同个网站或者IP的链接

网站内容(用户体验度)

指高质量的原创内容,再以用户体验度来衡量

时间

指上面的链接质量,数量,内容的建设稳定增加且持之以恒。

2.影响排名第二大因素:外链接锚文字

举个例子,你想把replica watches排到第一,那么链接在建立在数量和质量的基础上,锚文字为:replica watches才会对这个词有排名,你链接很多,而且质量很高,但一个带replica watches锚文字链接都没,那是不大可能有排名的。

3.网站关键词的使用

关键词在网站中出现的密度,位置,多样化都会影响排名,只是,这种影响已经降到第三。

4.PR对排名的影响

正如:MattCutts 说的:不要把PR的重要性看的过高,我们正在努力减少PR对排名的影响

在看了这排名图后,我相信大家以后在找友情链接时,不要单单以PR为唯一参考因素。更重要的,并不是每个PR7的网站都能给你传递权重的。所以不要每次有PR7的卖得很便宜就挣着买。

如果你是个SEOer, 对PR的这种崇拜,我建议还是降降温,PR只是影响网站排名的其中一个因素,如果按比例来说,那应该在10%-25%。

写得比较乱,而且也是个人见解,你有什么其他的看法,欢迎大家交流。