精华区 [关闭][返回]

当前位置:月光软件>>讨论区精华>>〖软件开发〗>>● ASP>>★ASP的应用★>>经典发现:可能是雅虎的搜索引擎数据库结

主题:经典发现:可能是雅虎的搜索引擎数据库结
发信人: wenxu()
整理人: netyum(2002-07-23 19:00:44), 站内信件
最近我在工作中偶尔猜想到雅虎的数据库结构,说明如下,可能并不一定就和
雅虎的一模一样,但是,这样的数据库结构足以构造雅虎搜狐类的搜索引擎,
如果有什么意见,请与我联系,谢谢!

数据库结构解析如下:
  1。该数据库其实并不是很复杂,两张表就可以搞定。
  ●表一:该表用来存储各种类别的名称及类别编号
  字段如:TYPENAME(类别名),TYPEID(类目编号)
  ★★★注意:在这张表中,第一个字段为分类的名称,第二个字段为分类的
  编号,该编号字段可由8个字节组成,而类别的编号方法是,比方说我们暂时

  只考虑大类目,细目,大类,小类四层(应根据所分层次的不同确定TYPEID字

的长度),大类目------2个字节,细目-----4个字节,大类----6个字节,
小类----8个字节(字节长度即为TYPEID字段的长度)。
  eg:TYPENAME**********TYPEID
    音乐(大类目)    *    02
  古典音乐(细目)    *    0201
西方古典音乐(大类)  *    020103
欧洲古典音乐(小类)  *    02010301
   ★★★注意大类目与其下级细目编号的联系!★★★

  ●表二:该表用来存储具体物件的名称及信息字段
   字段如:OBJNAME(物件名),OBJMAINID(给此物件定性的ID)
   ★★★注意:在这张表中最主要的是OBJMAINID字段,他存储了物件在第一张
表中究竟归属于哪个类别的信息,搞清楚这个字段的编码规则是这个数据库的
精华所在,下面,我举个例子,来说明这个字段是怎么编号的
   eg:比方说歌剧《浮士德》,他属于“西方古典音乐”这个大类,
  OBJNAME*****************************OBJMAINID
《我的太阳》(意大利名歌)              02010301_0000001    
                              (下画线后面的数字为该类的序列编号)
  ●在程序中,首先根据用户输入的查询条件在表二的OBJNAME字段中搜索
有没有哪个类的名称与之匹配,之后,在匹配的OBJNAME值中判断他的OBJMAINID

字段的编号,究竟属于哪个类型
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
总上所述,这个数据库的基本思路,纯熟本人思想,出错之处实数难免,
真挚的希望你给我意见,能够与我讨论讨论

[email protected]
lanmengju.126.com
oicq:2830840

--
※ 来源:.月光程序代码网 http://www.moon-soft.com.[FROM: 61.140.188.73]

[关闭][返回]






转载请注明:转载自 月光程序代码网 [ http://www.moon-soft.com ]