请问一下追词网的原理是什么?
<div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1"><span class="right">2009-12-18 12:13</span>
<b>cshack</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
<b>请问一下追词网的原理是什么?</b><br><br>请问一下追词网的原理是什么?<br />
<br />
一次查某个站,有几个热词排前面,这个是怎么做到的???</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 12:36</span>
<b>cshack</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
没人知道吗?????</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 12:48</span>
<b>hellode</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
ms<br />
之前已经收录过了...........<br />
不然调用没那么快........<br />
太快了.<br />
我做过百度的采集,不可能数据这么快,百度出结果好像都没这么快,<br />
我的猜测是:<br />
第一步:提取很多词.(就是大家习惯搜索的词-------这个应当用到词库,百度的相关搜索也很有作用)<br />
第二步:采集百度这些词的前5页(上面好像都是5页的数据,没过多测试)<br />
第三步:记录这些词的网址标题及相关排位等信息到库中,<br />
所以在大家查询的时侯能那么快出结果.<br />
并且有的时侯并不是最新排名,可能你在这个网上查了你在第一位,可能百度这时侯已把你放到第二位了,这更说明,所查询的数据并不是最新的而是之前就已经入库的(想像这库得有多大:L )<br />
<br />
还有一个是,当你查询一次你的网址后,应当会触发他对你这个网址上出现在的关键词重新采集更新,<br />
所以当你第二天再来看的时侯排名比第一次准..........<br />
<br />
[ 本帖最后由 hellode 于 2009-12-18 12:50 编辑 ]</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 12:52</span>
<b>cshack</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
www.cizui.com<br />
这个站啊,是这样吗?<br />
这也太难了!!!!!!</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 13:11</span>
<b>hetang</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
这个要点技术,偶不会。。。。</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 13:18</span>
<b>Dodosee</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
调的CNZZ的数据</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 14:50</span>
<b>potti</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
楼上正解</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 15:08</span>
<b>lieliu</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
用词库分析出你网站首页的分词,搜索各词的排名</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 15:44</span>
<b>蛤蟆</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
如果,没有大商家(CNZZ,GOOGLE,BAIDU,51之类的商家)的支持。小弟猜测其基本原理如下:<br />
<br />
1.确定关键词<br />
2.用GET方式,向百度查询查询该关键词,得到结果<br />
3.从结果中,匹配出所有的域名,然后入库<br />
<br />
其难点在于,如何维护这么庞大的库,以及数据库的效率。其次,就是关键词的定位<br />
<br />
[ 本帖最后由 蛤蟆 于 2009-12-18 15:46 编辑 ]</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 23:44</span>
<b>hellode</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
关键词的定位<br />
这是难点,也是决定成败的关键.............<br />
<br />
基本上和你想的原理是一样的.<br />
逆向思维,并不是根据网址去采相关数据,不现实,肯定是提前采好了.</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2009-12-18 23:55</span>
<b>阿汇</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
汗,你们所看到的调用,是cnzz的统计js而已。呵呵<br />
其实不是调用cnzz的,具体怎么实现的,楼下补充。</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2010-2-3 00:10</span>
<b>double2</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
呵呵,一步小心看到大家在讨论这个。<br />
追词是没有从cnzz取数据了。</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2010-2-3 11:08</span>
<b>bydeclan</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
原帖由 double2 于 2010-2-3 00:10 发表 http://bbs.pqshow.com/images/common/back.gif<br />
呵呵,一步小心看到大家在讨论这个。<br />
追词是没有从cnzz取数据了。 <br />
;P 这语气,貌似追词站长吧。。。</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2010-2-3 11:48</span>
<b>yuanzhang1987</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
追词网确实很NB的啊</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2010-2-3 14:27</span>
<b>xueshen</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
原帖由 double2 于 2010-2-3 00:10 发表 http://bbs.pqshow.com/images/common/back.gif<br />
呵呵,一步小心看到大家在讨论这个。<br />
追词是没有从cnzz取数据了。 <br />
<br />
没错了</div></div>
<br><div class="simpletable smalltxt" style="width: 98%"><div class="subtable altbg1">
<span class="right">2010-2-3 15:34</span>
<b>crazy7c</b></div>
<div class="subtable altbg2 t_msg" style="width: auto;height: auto">
友情帮顶,技术活不懂</div></div>
页:
[1]