网站制作

本类阅读TOP10

·IIS 安装配置全攻略
·用VS.NET打开网上下载的.NET web项目出错的解决办法
·HTML 4.0 语言快速参考
·限制TextArea区的文字输入数量
·如何在网页上实现进度条
·Apache的配置步骤及测试
·谈谈Jesse James Garrett提到的Ajax
·html基础学习笔记(2)
·页面垂直居中的两种方法
·用asp遍历目录下文件的例子

分类导航
VC语言Delphi
VB语言ASP
PerlJava
Script数据库
其他语言游戏开发
文件格式网站制作
软件工程.NET开发
搜索引擎中用户行为特征分析

作者:未知 来源:月光软件站 加入时间:2005-2-28 月光软件站

搜索引擎维护的两类信息:

       网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取)

 

传统IR技术:(information retrieval

       文档的向量空间模型

       Tf*idf算法

              ―――利用web信息本身的特点和用户行为信息补充

              ―――分析网页通过超连接形成的有向图

       Google    随机冲浪模型       pagerank技术排序

       Ibm clever      权威型&目录型网页    HITS计算权值

       天网       LHNlink hit number)计算权值

              用户经验少但是数量巨大――利用direct技术跟踪用户对检索结果的后续行为

Gray Cullis搜索引擎信息分类:

网页本身信息;链接信息;人工编目信息;用户行为信息。

基本的用户行为特征:

查询词分布情况统计

雷同查询的衰减

相邻n项查询词的偏差分析

翻页情况统计

用户点击url的分布情况统计

 

网页入度; 镜像度; 域名深度




相关文章

相关软件