问几个有关搜索的问题

photon 2010-05-17
出于折腾的目的,我想做一个类似这样的功能:抓取某论坛某板块内容并索引。比如,把je海版的内容抓下来,然后索引,提供一个搜索界面可以检索内容。

以前没接触过搜索技术,现有几处不太清楚:
1。je海版的内容抓下来之后,是否需要存放到某个地方?存到数据库还是直接写文件到硬盘?
2。是一边抓网页一边索引,还是抓一部分,暂停抓取,建立索引,再接着抓。。循环?
3。对性能暂时不太关注,不过有其它什么需要注意的地方吗?
Global site tag (gtag.js) - Google Analytics