X hits on this document

103 views

0 shares

0 downloads

0 comments

19 / 25

北京大学学士学位论文

   在一个文件中可以查到主机IP地址,主机上的页面数,主机上的页面网址在另一页面上的起始位置。在另一文件上,每个主机上的页面都存放在一起。根据起始位置和页面数,就可以顺序读取该主机上所有页面的网址。

用户查询时,可以输入主机的IP地址或主机域名,程序会自动将域名转化IP地址,然后根据IP地址从第一个文件中找到该主机的项,再根据第一个文件中的起始位置和页面数,从第二个文件中找到该主机上的所有页面。

   第一个文件只有几千项,查找时间较短。第二个文件虽然有一百多万项,但可以直接定位,顺序地读所有需要的项。所以,该算法的时间代价不高,可以满足实时查询的需要。

   第五章 日志文件信息处理的实现

§5.1 设计目标

1.

统计总查询次数,反映用户的使用情况。

2.

统计CACHE命中率,反映系统的运行效率。如果CACHE命中率过小,说明系统的效率需要改进。

3.

统计CACHE命中的查询所需要的总时间,和从数据库中得到查询结果的操作所需要的总时间。用来反映CACHE的效率如何,如果需要,可以以此数据为基础,变换CACHE的大小。这两个数据也反映了系统的平均查询时间,即对用户要求的反映速度。

4.

统计OR操作和AND操作的总次数,表明用户操作的类型,可以帮助估计系统处理的关键操作是什么,把提高系统性能的关键放在优化处理关键操作的算法上,较少出现的情况不必投入太多的精力。

5.

统计最近一个月内每天用户查询的次数,本年内每月的用户查询次数,去年的用户查询次数,和今年的用户查询次数。通过这组数据来反映系统近期内

19

Document info
Document views103
Page views103
Page last viewedMon Dec 05 03:17:28 UTC 2016
Pages25
Paragraphs544
Words834

Comments