走进搜索引擎
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.2 全

在传统信息检索(Information retrieval)中,将查全率(Recall)作为衡量检索是否全面的度量指标(查全率也称作召回率),查全率是查询出的相关网页数和全部相关网页数的比率。例如在搜索引擎中查询“XML”,如果世界上包含“XML”这个关键词的网页数为M,而实际该搜索引擎检索出这M条中的N条网页,那么查全率为N/M×100%。

是否能查得全,主要取决于网页索引库的大小。如果网页库只包含了2条XML的查询结果,即便都检索出来了,查全率也是极低的。可见,索引的网页数越多,越有助于提高查全率。