搜者SOOER.CN旗下网站
百 科 | 健康 | 电脑 | 程序设计 | Web开发 | PHP | 供求
请填写您的问题: 例如:怎么学PHP?
焊接 | 百科 | 交友 | 供求 | WAP
联盟 | 主页 | 工作 | MP3  | BT
本站最新推出智能机器人回答问题!
本站论坛! 上月老网,交世界朋友!
培训搜索引擎原理 [待解决]
悬赏分:0- 离问题结束还有 14 天 23.9 小时
作者:大徐 发表时间:2005-12-20 03:15:07
版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处。
http://daxu.net/archives/54.html
第二天,培训搜索引擎原理,请来PE工程师来讲全部大结果的组成。说实话,给我一个很大的震撼,我没想到搜索引擎技术是这样的强大和复杂。昨天的培训里我还积极提问和回答,但今天的培训我没有讲出一句话,不过尽力的还是把培训的内容基本听懂了。以前我也接触过一些搜索引擎的行业知识,甚至有过自己也做一个搜索引擎的想法,也知道搜索引擎是个庞大而复杂的事情,但今天我还是震撼了,没有想到会这么庞大和复杂。当讲培训的工程师说出全球2万多台高配置服务器以机群的方式分布处理各个环节的时候,虽然他的表情和语气很轻松,但给我的震撼是非同寻常的。

我想现在我有机会多学习,有机会参与这样的工作,我应该努力!再努力!

今天又查了两个米,都被n注册,surfer和antispam

另外,保存一下今天的“作业”

作业1:找到一篇认为比较有道理的有关第三代搜索引擎的文章;
如何做好一个垂直搜索引擎
http://www.xinfj.com/bbs/html/2005-12-7/1059428658.html


作业2:找三张图片,雅虎第一代首页、两张杨致远的照片,2005年和2000年各一张;

杨致远2005年照片
05年拜会中国互联网协会与胡启恒理事长的合影
百度图片搜索,关键字“杨致远”,结果第一个:杨致远(中)与塞梅尔(左)昨天视察了雅虎中国公司。
百度图片搜索,关键字“雅虎创始人”及“雅虎”搜索的结果也出现杨致远照片。
中搜图片,关键字“雅虎创始人”,“杨致远”,结果第一页均有结果,但也有其他图片结果。

杨致远2000年照片

百度图片搜索,关键字“杨致远2000年照片”,无结果;
百度图片搜索,关键字“杨致远”,第二页,杨致远简历中有早期照片
http://www.bookcool.com/online/jingji/cfdh-gb/0/20.htm

作业3:google创始人的信息;
百度网页搜索,关键字“google创始人”,结果第一页,第二个结果;
Google创始人佩奇和布林简介
http://it.sohu.com/20040820/n221629896.shtml

作业4:部落这个产品有什么问题,如果亲自管理,有什么建议。
问题:垃圾信息,缺乏对内容合理的控制。我曾经测试过匿名每隔1分钟向相同社区发表相同内容的贴,第二个发过以后ip即被封,但经过刷新却见到相同的其他准色情垃圾信息层出不穷;
对策:对匿名/注册用户发布的信息严格审核,加强对违规用户的惩罚力度。百度知道和贴吧已经开始对违规用户进行惩罚,说明他们在要流量要用户的同时也开始注重此类产品的质量。
百度知道违规被封用户名单
http://www.baidu.com/search/zhidao/weigui.html

问题:来同一个部落的人具有共同的爱好,或是说兴趣,目前的部落还没有访问者互相交流的内容。
对策:
1、建立即时聊天室,所有进入同一部落社区的用户可以进入此聊天室及时互动。
2、增加贴主属性,比如增加与贴主/吧主交友、个人资料、部落社区级别等信息。
发表者:admin 于 2008-08-09 00:32:26

  相关问题
搜索引擎学习资源收集
VBS脚本病毒原理分析及防范[转载]
请大家看我结合Lucene做的电影搜索引擎
发现frameset的标记要跨越body,请问原理
如何通过字分页,就象新浪的那样,还有关于HTML生成的原理
急!!!在线等!webwork + tomcat (安装版的) 正常用的时候都没有问题,可是这次培训,并发的用户数在40个左右,出问题了

  搜者俱乐部
创建培训俱乐部
访问搜索引擎俱乐部(1)
创建原理俱乐部
创建培训搜索引擎原理俱乐部



友情链接 - 使用说明 - 关于本站 - 关于我们 - 联系方式 - 技术支持
版权所有:WEB知识堂 程序制作:九烟 QQ: 2838905

页面执行时间 0.064 秒

网站信息只供参考使用,小心采用,一切后果自行负责!本站部分内容从网络整理而来,如有版权方面的限制,请与本站联系,我们将妥善处理。