天津大学《化工信息学》第二次作业
1.百度搜索引擎工作原理:搜索引擎为用户展
现的每一条搜索结果,都对应着互联网上的一个页面。每一条搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取、过滤、建立索引和输出结果。
抓取
Baiduspider,或称百度蜘蛛,会通过搜索引擎系统的计算,来决定对哪些网站施行抓取,以及抓取的内容和频率值。搜索引擎的计算过程会参考您的网站在历史中的表现,比如内容是否足够优质,是否存在对用户不友好的设置,是否存在过度的搜索引擎优化行为等等。
当您的网站产生新内容时,Baiduspider会通过互联网中某个指向该页面的链接进行访问和抓取,如果您没有设置任何外部链接指向网站中的新增内容,则Baiduspider是无法对其进行抓取的。对于已被抓取过的内容,搜索引擎会对抓取的页面进行记录,并依据这些页面对用户的重要程度安排不同频次的抓取更新工作。
需您要注意的是,有一些抓取软件,为了各种目的,会伪装成Baiduspider对您的网站进行抓取,这可能是不受控制的抓取行为,严重时会影响到网站的正常运作。点此识别Baiduspider 的真伪。
过滤
互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接,空白内容页面等。这些网页对用户、站长和百度来说,都没有足够的价值,因此百度会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦。
建立索引
百度对抓取回来的内容会逐一进行标记和识别,并将这些标记进行储存为结构化的数据,比如网页的tagtitle、metadescripiton、网页外链及描述、抓取记录。同时,也会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹配。
输出结果
用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。
谷歌搜索引擎工作原理:工作原理
(一)搜集资讯:搜索引擎靠机器人程式
(spider)处理网站资料的收录工作
(二)整理资讯:搜索引擎整理资讯的过程
称为「建立索引」,搜索引擎不仅要
保存搜集起來的资讯,还要將它们按
照一定的规则进行编排
(三)接受查询:用戶向搜索引擎发出查询,
搜索引擎接受查询并向用戶返回资料
2.intitle的功能:搜索网页标题,即搜索HTML的title部分,使用这个搜索操作符可以方便地到以关键字做标题的网页。
Inurl的功能:搜索在连接到网页的url(超链接地址),使用这个搜索操作符可
以查询指定的链接地址,比如:我们所做的外链是论坛,那么我们可以在百度搜索框输入(inurl:bbs)再搜索,在搜索的结果中我们就可以看到都是bbs论坛。通过inurl:指令查询到大量的外链资源。
Inanchor的功能:搜索有超链接url的文本。
Intext的功能:只搜索网页正文(忽略链接文字,标题和url)。可以方便到
35岁学点什么技术
正文中有关键字的网页。
操作符联合搜索的体会:在搜索时使用一些操作符,就能提高搜索的精确度。操作符联合搜索更加提高了搜索的精确度。
3.百度的特点:在中文搜索领域做的还不错,收录的中文网页比谷
歌稍多。低学历,非IT专业人士使用较多。
谷歌:技术含金量最高的搜索引擎。全球性的搜索引擎,市场占有全球第一。但其中文搜索退出大陆搬到香港后,大陆使用不太稳定。目前大陆的使用者主要是高学历、高收入、高消费的20~35岁的人士。IT届人士使用较多。需要搜索外文的也都用谷歌。雅虎:相对于前者,雅虎的搜索技术已落后了,但其提供的内容非常丰富,类似门户网站。
4.百度与谷歌的对比:一、整体彩感觉对比
百度彩配搭简单:主蓝和红和白背景。整体感觉明快、简洁。Google彩配搭相对而言显得比较复杂化,个人感觉相对多了些调变化。就这一点而言,百度如果说得到10分,Google只能得8分
二、栏目内容设计对比
从分层而言
百度分层有: 1、"登陆"
2、"LOGO"
3、"百度相关常用产品:新闻 -网页-贴吧 -知道-MP3 -图片-视频"
4、"搜索框+按钮+设置"
5、"也是百度相关常用产品:空间 -hao123 +一个“更多”链接进入百度更多的产品页面"
6、"提示语:把百度设为主页"
7、"加入百度推广 | 搜索风云榜 | 关于百度 | About Baidu" --也是百度的相关产品以及百度公司的介绍链接
8、"?2009 Baidu 使用百度前必读京ICP证030173号 " 百度的版本声明和证件号码
百度一共用分成了八层。(在中国人眼里8是个好数据。这也怪不得百度做得这么好了)
Google的分层::
1、Google相关产品:"网页- 图片- 视频 -地图 -资讯 -音乐- 问答? 来吧? 更多▼"+"个性化首页"
2、"LOGO"
3、左边"搜索框+按钮" ,右边“高级搜索- 使用偏好- 语言工具”
4、Google相关产品:"视频-图片-购物-地图-音乐-翻译-265导航" 以Flash形式出现
5、Google更多产品链接和英文版本的Google链接:"广告计划 - Google 大全 - www.doczj/doc/ac25e9d90066f5335b8121f6.html in English" 这里的广告计划与加入百度推广是一样的目的。可是感觉就是不一样
6、"提示语:把Google设为主页"
7、"?2009 - 隐私权政策 - ICP证合字B2-20070004号" --也是Google的版本声明和证件号码
在这里一层一层的进行了对比感觉Google为什么与百度相比之下,中国的网民更加喜欢百度了。先说下中国的民族习惯,从中国自古以来的文章排版中可以看出中国民众是喜欢有律,
横竖整齐有序的排版模式,一目了然就是最好的。然而在这方面百度又是比Google 好。
在层数划分方面百度比Google多一层,然而看上去Google显得比百度拥挤多了。特别
是在第六层中的提示语那,百度设为主面就比Google设为主面更加的显眼醒目。
第一层对比:百度只有右边的“登陆”而Google左边有一大堆的产品引导链接。。右边又有个性化首页设计。在这里感觉上Google是否显得头重脚轻了呢?
第二层对比:同是LOGO设计。这里是一种企业文化,企业取向等各方面的体现。。相对而言是没有可比之说。而得个人认为。百度的Logo就是比Goolge的好看。为什么呢?设计比较形体四方化。不像Google英文加中文那么复杂化。还有就是Google这英文看起来感觉好像在走路不像百度坐得这么稳呵呵。
第三层对比:因为百度把他的主要的产品放在搜索框上面。。自然可能以获取到更加多的注意力。对比google把那么多的产品导航放到页面最顶部效果显然更加好。对于百度的这一层应该与Google的第一层和第四层对比。Google在这里产品导航设计个人感觉是有些显得多此一举的地方。比如说产品的导航设计重复。如“图片”、“视频”、“音乐”上面有下面也有,不
知道Google和百度有没有自己首页专门对页面统计工具用于改善用户体验度。如果说都有的话。个人认为,百度的相关产品关注度会比Google的来得更加高。Google的flash动态图片按钮是否会吸引到用户呢?还是影响了用户体验呢?
第四层对比: 百度把"搜索框+按钮+设置"整合到一层了。这里完全没有感觉到他们这些不是同一功能的。在这里我可是对Google严重不满意了。Google的搜索按钮是在下面的感觉和Google搜索框是分开的。而且还多了一个什么“手气不错”这个感觉严重破坏搜索体验。在什么也没有输入的情况下。百度点击按钮直接返回首页不变,Google点出Google搜索也是直接返回搜索引擎首页,而点那个“手气不错,跳到一个新的页面。请输入查询,Google祝您每天都有好运气( 手气不错 )! 最后是设置的对比。百度直接是“设置”和"高级"而Google搞了“高级搜索- 使用偏好- 语言工具”其文字之多不用说了。我知道这影响我的体验了。不知道其它用户会有什么想法。还有就是Google在这里字体设计还真是大。
第五层对比:百度这里有“空间 +hao123 +更多”对应应该和 Google第四层对比。百度这里在主打产品百度搜索。。百度搜索是在那里?重点是在搜索框上。。在这里慢慢开始设置小起来了。而Google在这个相关产品设计却花了不少的主页空间来介绍。这里是否使Google主次不分了
第六层对比:把百度设为主页。在上面空出了一大空间后。把百度设为主页显得那么自然显眼。而Google在这里的"把Google设为主页广告计划 - Google 大全 - www.doczj/doc/ac25e9d90066f5335b8121f6.html in English"设置在""显得多么的不自然而拥挤。
以下第七层,第八层没有过多的对比意义。唯一有对比的就是“广告计划”与百度的“加入百度推广”字面意思上的潜意识感觉了,这文章一开始对比就是在说Google的不好了。而整篇文章的对比都是显得Google的不足。是否Google真的不好呢?这个仁者见仁的事了呵呵。不同的角度,所看到的风景也就不一样,你从上看到下面,是否感觉到百度的首页是那种有头有尾的感觉呢??而Google像个头大尾细的产品。
百度它层次分明,而Google主次不分呢?? 这也许只有用户你自己知道。从这次比较同时也可以看出优化用户体验也是网络营销需要重点注意到的。
建议:当需要中文方面的专业知识时就用百度,需要英文方面的专业知识时就用谷歌。
所需信息最佳的网站:www.doczj/doc/ac25e9d90066f5335b8121f6.html /
5.论文:Gold’s future role in fuel cell systems
Don Camerona, Richard Hollidayb,*, David Thompsonb
aInteract Consultancy, Reading, UK