RSS 输出摘要

February 7th, 2006 in 因特网 | 16 留言

keso 这个关于 RSS 输出摘要还是全文的小调查,让这方面的讨论又热闹起来。你看到了,我选择的是输出摘要,列几条我的理由:

1、如我前面一个帖子提到过的,输出全文 RSS 是很浪费资源的,不管是流量还是存储空间。现在新闻聚合网站越来越多,网友使用的桌面新闻阅读器的数量更是巨大,每个网站和阅读器每一个小时读一次你的 RSS,这是很巨大的流量压力。当然,可以使用 feedburner 这种服务解决这个问题,但这种服务会丢失一点你的独立性,而且不是所有人都是知道怎么做的。另外,即使你使用了这种服务,网路传输的压力并没减轻。输出摘要,可能会整体上让因特网流畅一点。

2、存储空间的浪费。同样的内容,在无数网站,无数电脑上重复存放,这是不是浪费?这有时候也会给人带来烦恼,比如我们搜索的时候,发现结果里面有很大一部分实际上是一样的内容,只是被聚合到了不同的网站上。

3、版权问题。有许多很不道德的商业网站,把 blog 内容聚合过去,并不管你明确说明了 姓名標示-非商業性-相同方式分享。在这种现状下,blogger 要学会自我保护。过去我认为截取摘要的事情应该由聚合网站来做,但 Che Dong 的评论逐渐点醒我:新闻发布者也有义务不给商业网站侵犯版权的机会。

4、有人说全文输出有利于阅读,这对于订阅大量 RSS,每天阅读时间有限的人来说是不成立的。我个人阅读 RSS 的方式是:扫一眼标题和头几句话,感兴趣的话再细看。这种阅读方式应该是很科学的,我们阅读科技刊物,都是先扫描一遍目录,再看看感兴趣的文章的摘要,如果还感兴趣的话,看全文。当然,不少 blog 其实只是网摘,再输出摘要就无意义了。

如果你也和我一样,选择输出摘要,那么我有个建议。这个建议也是说给我自己听的。和写科技论文时一样,帖子的标题和摘要应该尽量准确反应帖子的内容。当然,估计一般人都和我一样懒得写帖子的时候,专门写个摘要。所以帖子的开头要尽量点好题,因为一般 blog 程序都会截取头一段作为摘要。

关键词:

tag-powered 桑林志

October 21st, 2005 in 因特网, 站记 | 22 留言

每天修改一点点,这样子鼓捣了好几天,现在桑林志可以说是 tag-powered。呵呵。比如:你点击帖子下一个 tag,不仅会显示桑林志该 tag 下的帖子,同时会显示该 tag下 technorati的文章, flickr的图片, 还有del.icio.us的链接。你也可以在首页右上角的文字框里输入一个关键字,来获取相关的信息,即使桑林志并没有这个 tag 也没有关系。有时候会因为某些网络原因出错,但一般重新刷新一次就可以了。

实现的方法很简单。首先,安装上 Jerome’s Keywords。可能还有别的WordPress Tagging 插件,但是我觉得这个已经很不错。然后,建立一个 tags.php 模板,来定制 tag 搜索结果页面。接着在这个tags.php 里加上几句来使用 magpiersstechnorati, flickr, 还有del.icio.us,读取相关 tag 的 rss。这样子,就可以了。你甚至不需要安装magpierss,因为 WordPress 实际上已经内置了,就是 wp-include/rss-functions.php,只要 require_once 就可以了。当然,你得注意设置 cache,不然被这些服务 blacklisted 可不是好玩的。至于右上角那个tag框,只是一个form而已,可以查看网页源文件。

关键词: , , , , , ,

rss 新闻聚合的资源浪费一面

October 17th, 2005 in 因特网 | 2 留言

rss 聚合的版权问题又有人在讨论了(123),希望这次能导向一些结果。

但是,我觉得 rss 新闻聚合还有一个更朴素的问题:资源浪费。同样一个内容,在无数网站上重复存放,这是否是浪费呢?当然,因为目前存储非常便宜,人会说,相对于聚合下阅读的方便,数据的重复不是一个真正问题。

rss 新闻聚合有时候也会给人带来烦恼,比如我们搜索的时候,发现结果里面有很大一部分实际上是一样的内容,只是被聚合到了不同的网站上。

我倾向于认为合理的rss新闻聚合方式是,只聚合标题以及摘要,而不包括全文。

关键词: , ,