官方微信号
图图微信号
2021-08-06 10:29:41 山西银行招聘考试网 //sx.huatu.com/jinrong/ 文章来源:互联网
【导读】华图山西金融考试网同步互联网发布:2021年军队文职计算机岗面试练习:百度搜索引擎的原理更多资讯请关注山西华图微信公众号(shanxiht),山西金融培训咨询电话:400-0351-222
招聘公告:2021年军队文职计算机岗面试练习:百度搜索引擎的原理
|
|
招聘人数:人
|
报名时间:
|
备考图书:点击查看金融招聘备考图书
|
网校课程:点击查看金融招聘在线课程
|
山西电话:400-0351-222
|
2021年军队文职计算机岗面试练习:百度搜索引擎的原理
军队文职面试备考要多多练题,在练题的过程中要不断思考,逐步形成适合自己的答题思路。今天,给大家带来了一道文职计算机面试模拟题,建议各位看到题目自己先答一下,然后跟参考答案对比,看看与答案的区别在什么地方,有缺失的地方及时改进。
【题目】
简述百度搜索引擎的原理。
【解题思路】
组织流程题,可按照事前、事中、事后三部分开展。
【参考答案】
大概分为三个阶段:
第一,爬行和抓取。为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的超链接,从一个页面爬到下一个页面。整个互联网是由相互链接的网站及页面组成的。从理论上说,蜘蛛从任何一个页面出发,顺着超链接都可以爬行到网上的所有页面。
第二,预处理。“预处理”也被简称为“索引”。搜索引擎蜘蛛抓取的原始页面,还要做大量的预处理工作,为最后的查询排名做好准备。其中,最重要的就是提取关键词,建立索引文件。其他还包括内容过滤去除重复网页、一些明显的欺骗用户的网页,死链接,空白内容页面(这些网页对用户和百度来说,都是没有价值的);分词(中文)、判断网页类型、分析超链接、计算网页的重要度、丰富度等。
第三,排名结果输出。用户输入关键词后,排名程序调用索引库数据,会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户该关键词最匹配最有价值的网页。
(编辑:wangjunna)上一篇:2022年银行招聘热点题库_秋招必做1000题(十三)
下一篇:没有了
华图金融公众号
暖心图书放送