Total Pageviews

Saturday, 17 November 2012

Full-Text RSS,获取任意网站全文RSS的PHP程序



Full-Text RSS获取任意网站的全文RSS的方法很多,比如手动抓取的Yahoo pipes,自动的fullrss.sinaapp.com等服务。这些免费服务提供都来源于他人。不知道什么时候就不能用了,与fullrss.sinaapp.com同样基于Readability的Full-Text RSS,除了提供免费在全文RSS输出外,还提供了PHP程序供下载使用。

搭建Full-Text RSS

http://fivefilters.org/content-only/
FiveFilters的Full-Text RSS基于PHP 5.2以上版本,不要求数据库支持,基本各种免费虚拟主机都支持。程序本身包含了兼容性检测操作,也可以事先下载官方检测程序。
Full-Text RSS最新版是V3.0,是收费的,但V2.8是开源的,官方提供了下载地址:
http://code.fivefilters.org/full-text-rss
安装步骤:

    复制config.php为custom_config.php,按需修改参数;
    复制index.php为custom_index.php,按需修改参数;
    上传服务器。

前面2步都是非必须的,可以完全直接上传zip文件,按官方默认设置和显示就行。

Full-Text RSS的执行说起来也简单:输入网站RSS地址——后台自动分析RSS所有文章链接——自动提取连接到Readability——Readability返回每个链接的全文内容——自动将所有全文内容按原始RSS顺序烧录成一个新的全文RSS地址。
只要承载Full-Text RSS程序的网站地址可以访问,则烧录的全文RSS可以在任意RSS阅读器正常访问。
Full-Text RSS弥补了Readability不支持自动识别整个网站的缺憾,但也继承了Readability的兼容性问题。完美的全文RSS还是Yahoo pipes好使。
---------------------------------------------------------
在你的vps上安装git,然后
# cd /path/to/ur-document-root
# git clone https://bitbucket.org/fivefilters/full-text-rss.git
然后访问http://urdomain.com/full-text-rss,按照该页面的提示,操作即可。


Installation

1. Extract the files in this ZIP archive to a folder on your computer.

2. FTP the files up to your server

3. Access index.php through your browser. E.g. http://example.org/full-text-rss/index.php

4. Enter a URL in the form field to test the code

5. If you get an RSS feed with full-text content, all is working well. :)
 
 
 Configuration (optional)

1. Save a copy of config.php as custom_config.php and edit custom_config.php

2. If you decide to enable caching, make sure the cache folder (and its 2 sub folders) is writable.
(you might need to change the permissions of these folders to 777 through your FTP client).

from http://code.fivefilters.org/full-text-rss