Yioop(http://www.seekquarry.com/)是采用PHP构建的一个开放源码的搜索引擎,并使用MySQL或 SQLite存储数据 。
它可以配置抓取任何网页下面的链接,它发现,或对任何给定的 URL数量有限,作为一个网站的搜索引擎(如Google自定义搜索)。
标准的安装程序,可以抓取,并增加每天的网页索引数百万,这个数字可以运行更多的爬虫(分布式设置也是可行的)。
是的HTML,DOC,PNG,JPG,GIF,XML的网站地图,RSS和更多的支持,其中包括许多文件类型编制索引 。
此外,该系统可以完全控制从一个基于Web的管理界面。
要求: PHP 5.3 + MySQL 或者 SQLite
No comments:
Post a Comment