当前位置:Gxlcms > Python > 用Python的Django框架来制作一个RSS阅读器

用Python的Django框架来制作一个RSS阅读器

时间:2021-07-01 10:21:17 帮助过:16人阅读

Django带来了一个高级的聚合生成框架,它使得创建RSS和Atom feeds变得非常容易。

什么是RSS? 什么是Atom?

RSS和Atom都是基于XML的格式,你可以用它来提供有关你站点内容的自动更新的feed。 了解更多关于RSS的可以访问 http://www.whatisrss.com/, 更多Atom的信息可以访问 http://www.atomenabled.org/.

想创建一个联合供稿的源(syndication feed),所需要做的只是写一个简短的python类。 你可以创建任意多的源(feed)。

高级feed生成框架是一个默认绑定到/feeds/的视图,Django使用URL的其它部分(在/feeds/之后的任何东西)来决定输出 哪个feed Django uses the remainder of the URL (everything after /feeds/ ) to determine which feed to return.

要创建一个 sitemap,你只需要写一个 Sitemap 类然后配置你的URLconf指向它。
初始化

为了在您的Django站点中激活syndication feeds, 添加如下的 URLconf:

(r'^feeds/(?P.*)/$', 'django.contrib.syndication.views.feed',
  {'feed_dict': feeds}
),

这一行告诉Django使用RSS框架处理所有的以 "feeds/" 开头的URL. ( 你可以修改 "feeds/" 前缀以满足您自己的要求. )

URLConf里有一行参数: {'feed_dict': feeds},这个参数可以把对应URL需要发布的feed内容传递给 syndication framework

特别的,feed_dict应该是一个映射feed的slug(简短URL标签)到它的Feed类的字典 你可以在URL配置本身里定义feed_dict,这里是一个完整的例子 You can define the feed_dict in the URLconf itself. Here's a full example URLconf:

from django.conf.urls.defaults import *
from mysite.feeds import LatestEntries, LatestEntriesByCategory

feeds = {
  'latest': LatestEntries,
  'categories': LatestEntriesByCategory,
}

urlpatterns = patterns('',
  # ...
  (r'^feeds/(?P.*)/$', 'django.contrib.syndication.views.feed',
    {'feed_dict': feeds}),
  # ...
)

前面的例子注册了两个feed:

  1. LatestEntries``表示的内容将对应到``feeds/latest/ .
  2. LatestEntriesByCategory``的内容将对应到 ``feeds/categories/ .

以上的设定完成之后,接下来需要自己定义 Feed 类

一个 Feed 类是一个简单的python类,用来表示一个syndication feed. 一个feed可能是简单的 (例如一个站点新闻feed,或者最基本的,显示一个blog的最新条目),也可能更加复杂(例如一个显示blog某一类别下所有条目的feed。 这里类别 category 是个变量).

Feed类必须继承django.contrib.syndication.feeds.Feed,它们可以在你的代码树的任何位置
一个简单的Feed

This simple example describes a feed of the latest five blog entries for a given blog:

from django.contrib.syndication.feeds import Feed
from mysite.blog.models import Entry

class LatestEntries(Feed):
  title = "My Blog"
  link = "/archive/"
  description = "The latest news about stuff."

  def items(self):
    return Entry.objects.order_by('-pub_date')[:5]

要注意的重要的事情如下所示:

  • 子类 django.contrib.syndication.feeds.Feed .
  • title , link , 和 description 对应一个标准 RSS 里的 , , 和 <description> 标签.</li> <li> items() 是一个方法,返回一个用以包含在包含在feed的 <item> 元素里的 list 虽然例子里用Djangos database API返回的 NewsItem 对象, items() 不一定必须返回 model的实例 Although this example returns Entry objects using Django's database API, items() doesn't have to return model instances.</li> </ul> <p>还有一个步骤,在一个RSS feed里,每个(item)有一个(title),(link)和(description),我们需要告诉框架 把数据放到这些元素中 In an RSS feed, each <item> has a <title> , , and <description> . We need to tell the framework what data to put into those elements.</p> <p> 如果要指定 <title> 和 <description> ,可以建立一个Django模板(见Chapter 4)名字叫 feeds/latest_title.html 和 feeds/latest_description.html ,后者是URLConf里为对应feed指定的 slug 。注意 .html 后缀是必须的。 Note that the .html extension is required.</p> <p> RSS系统模板渲染每一个条目,需要给传递2个参数给模板上下文变量:</p> <ol> <li> obj : 当前对象 ( 返回到 items() 任意对象之一 )。</li> <li> site : 一个表示当前站点的 django.models.core.sites.Site 对象。 这对于 {{ site.domain }} 或者 {{ site.name }} 很有用。</li> </ol> <p> 如果你在创建模板的时候,没有指明标题或者描述信息,框架会默认使用 "{{ obj }}" ,对象的字符串表示。 (For model objects, this will be the __unicode__() method.</p> <p> 你也可以通过修改 Feed 类中的两个属性 title_template 和 description_template 来改变这两个模板的名字。</p> <p> 你有两种方法来指定 的内容。 Django 首先执行 items() 中每一项的 get_absolute_url() 方法。 如果该方法不存在,就会尝试执行 Feed 类中的 item_link() 方法,并将自身作为 item 参数传递进去。</p> <p> get_absolute_url() 和 item_link() 都应该以Python字符串形式返回URL。</p> <p> 对于前面提到的 LatestEntries 例子,我们可以实现一个简单的feed模板。 latest_title.html 包括:</p> <p>{{ obj.title }}</p> <p> 并且 latest_description.html 包含:</p> <p>{{ obj.description }}</p> <p> 这真是 太 简单了!</p> <p><strong>一个更复杂的Feed</strong></p> <p>框架通过参数支持更加复杂的feeds。</p> <p>For example, say your blog offers an RSS feed for every distinct tag you've used to categorize your entries. 如果为每一个单独的区域建立一个 Feed 类就显得很不明智。</p> <p>取而代之的方法是,使用聚合框架来产生一个通用的源,使其可以根据feeds URL返回相应的信息。</p> <p>Your tag-specific feeds could use URLs like this:</p> <p> http://example.com/feeds/tags/python/ : Returns recent entries tagged with python</p> <p> http://example.com/feeds/tags/cats/ : Returns recent entries tagged with cats</p> <p>固定的那一部分是 "beats" (区域)。</p> <p>举个例子会澄清一切。 下面是每个地区特定的feeds:</p> <div class="jb51code"> <pre class="brush:py;"> from django.core.exceptions import ObjectDoesNotExist from mysite.blog.models import Entry, Tag class TagFeed(Feed): def get_object(self, bits): # In case of "/feeds/tags/cats/dogs/mice/", or other such # clutter, check that bits has only one member. if len(bits) != 1: raise ObjectDoesNotExist return Tag.objects.get(tag=bits[0]) def title(self, obj): return "My Blog: Entries tagged with %s" % obj.tag def link(self, obj): return obj.get_absolute_url() def description(self, obj): return "Entries tagged with %s" % obj.tag def items(self, obj): entries = Entry.objects.filter(tags__id__exact=obj.id) return entries.order_by('-pub_date')[:30] </script></pre> </p> <p>以下是RSS框架的基本算法,我们假设通过URL /rss/beats/0613/ 来访问这个类:</p> <p> 框架获得了URL /rss/beats/0613/ 并且注意到URL中的slug部分后面含有更多的信息。 它将斜杠("/" )作为分隔符,把剩余的字符串分割开作为参数,调用 Feed 类的 get_object() 方法。</p> <p> 在这个例子中,添加的信息是 ['0613'] 。对于 /rss/beats/0613/foo/bar/ 的一个URL请求, 这些信息就是 ['0613', 'foo', 'bar'] 。</p> <p> get_object() 就根据给定的 bits 值来返回区域信息。</p> <p> In this case, it uses the Django database API to retrieve the Tag . Note that get_object() should raise django.core.exceptions.ObjectDoesNotExist if given invalid parameters. 在 Beat.objects.get() 调用中也没有出现 try /except 代码块。 函数在出错时抛出 Beat.DoesNotExist 异常,而 Beat.DoesNotExist 是 ObjectDoesNotExist 异常的一个子类型。</p> <p> 为产生 <title> , , 和 <description> 的feeds, Django使用 title() , link() , 和 description() 方法。 在上面的例子中,它们都是简单的字符串类型的类属性,而这个例子表明,它们既可以是字符串, 也可以是 方法。 对于每一个 title , link 和 description 的组合,Django使用以下的算法:</p> <p> 试图调用一个函数,并且以 get_object() 返回的对象作为参数传递给 obj 参数。</p> <p> 如果没有成功,则不带参数调用一个方法。</p> <p> 还不成功,则使用类属性。</p> <p> 最后,值得注意的是,这个例子中的 items() 使用 obj 参数。 对于 items 的算法就如同上面第一步所描述的那样,首先尝试 items(obj) , 然后是 items() ,最后是 items 类属性(必须是一个列表)。</p> <p>Feed 类所有方法和属性的完整文档,请参考官方的Django文档 (http://www.djangoproject.com/documentation/0.96/syndication_feeds/) 。<br /> 指定Feed的类型</p> <p>默认情况下, 聚合框架生成RSS 2.0. 要改变这样的情况, 在 Feed 类中添加一个 feed_type 属性. To change that, add a feed_type attribute to your Feed class:</p> <div class="jb51code"> <pre class="brush:py;"> from django.utils.feedgenerator import Atom1Feed class MyFeed(Feed): feed_type = Atom1Feed </script></pre> </p> <p>注意你把 feed_type 赋值成一个类对象,而不是类实例。 目前合法的Feed类型如表所示。<br /> </p> <p><img alt="2015722150842180.jpg (705×179)" src="http://files.jb51.net/file_images/article/201507/2015722150842180.jpg?201562215857" /></p> <p></p> <p><strong>闭包</strong></p> <p>为了指定闭包(例如,与feed项比方说MP3 feeds相关联的媒体资源信息),使用 item_enclosure_url , item_enclosure_length , 以及 item_enclosure_mime_type ,比如</p> <div class="jb51code"> <pre class="brush:py;"> from myproject.models import Song class MyFeedWithEnclosures(Feed): title = "Example feed with enclosures" link = "/feeds/example-with-enclosures/" def items(self): return Song.objects.all()[:30] def item_enclosure_url(self, item): return item.song_url def item_enclosure_length(self, item): return item.song_length item_enclosure_mime_type = "audio/mpeg" </script></pre> </p> <p>当然,你首先要创建一个包含有 song_url 和 song_length (比如按照字节计算的长度)域的 Song 对象。<br /> <strong>语言</strong></p> <p>聚合框架自动创建的Feed包含适当的 <language> 标签(RSS 2.0) 或 xml:lang 属性(Atom). 他直接来自于您的 LANGUAGE_CODE 设置. This comes directly from your LANGUAGE_CODE setting.<br /> <strong>URLs</strong></p> <p>link 方法/属性可以以绝对URL的形式(例如, "/blog/" )或者指定协议和域名的URL的形式返回(例如 "http://www.example.com/blog/" )。如果 link 没有返回域名,聚合框架会根据 SITE_ID 设置,自动的插入当前站点的域信息。 (See Chapter 16 for more on SITE_ID and the sites framework.)</p> <p>Atom feeds需要 指明feeds现在的位置。 The syndication framework populates this automatically.<br /> <strong>同时发布Atom and RSS</strong></p> <p>一些开发人员想 同时 支持Atom和RSS。 这在Django中很容易实现: 只需创建一个你的 feed 类的子类,然后修改 feed_type ,并且更新URLconf内容。 下面是一个完整的例子: Here's a full example:</p> <div class="jb51code"> <pre class="brush:py;"> from django.contrib.syndication.feeds import Feed from django.utils.feedgenerator import Atom1Feed from mysite.blog.models import Entry class RssLatestEntries(Feed): title = "My Blog" link = "/archive/" description = "The latest news about stuff." def items(self): return Entry.objects.order_by('-pub_date')[:5] class AtomLatestEntries(RssLatestEntries): feed_type = Atom1Feed </script></pre> </p> <p>这是与之相对应那个的URLconf:</p> <div class="jb51code"> <pre class="brush:py;"> from django.conf.urls.defaults import * from myproject.feeds import RssLatestEntries, AtomLatestEntries feeds = { 'rss': RssLatestEntries, 'atom': AtomLatestEntries, } urlpatterns = patterns('', # ... (r'^feeds/(?P<url>.*)/$', 'django.contrib.syndication.views.feed', {'feed_dict': feeds}), # ... ) </script></pre> </div> <div class=""> <ul class="m-news-opt fix"> <li class="opt-item"> <a href='/python-354929.html' target='_blank'><p>< 上一篇</p><p class="ellipsis">利用Python的Django框架生成PDF文件的教程</p></a> </li> <li class="opt-item ta-r"> <a href='/python-354931.html' target='_blank'><p>下一篇 ></p><p class="ellipsis">在Django中管理Users和Permissions以及Groups的方法</p></a> </li> </ul> </div> </div> </div> <div class="g-title fix"> <h2 class="title-txt">人气教程排行</h2> </div> <div class="m-rank u-dashed mb40"> <ul> <li class="rank-item"> <a href="/python-361871.html" title='对Python2.7pandas中的read_excel详解' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">384次</span> <span class="g-sort-num top">1</span> 对Python2.7pandas中的read_excel详解 </a> </li> <li class="rank-item"> <a href="/python-357851.html" title='Python实现定时弹窗提醒' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">383次</span> <span class="g-sort-num second">2</span> Python实现定时弹窗提醒 </a> </li> <li class="rank-item"> <a href="/python-359898.html" title='python爬虫入门(3)--利用requests构建知乎API' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">383次</span> <span class="g-sort-num third">3</span> python爬虫入门(3)--利用requests构建知乎API </a> </li> <li class="rank-item"> <a href="/python-361328.html" title='python如何爬取搜狗微信公众号文章永久链接的思路解析' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">382次</span> <span class="g-sort-num ">4</span> python如何爬取搜狗微信公众号文章永久链接的思路解析 </a> </li> <li class="rank-item"> <a href="/python-363639.html" title='python字典的键可以相同吗' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">381次</span> <span class="g-sort-num ">5</span> python字典的键可以相同吗 </a> </li> <li class="rank-item"> <a href="/python-462846.html" title='python是一种面向什么的语言?' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">381次</span> <span class="g-sort-num ">6</span> python是一种面向什么的语言? </a> </li> <li class="rank-item"> <a href="/python-355903.html" title='python通过pil为png图片填充上背景颜色的方法' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">381次</span> <span class="g-sort-num ">7</span> python通过pil为png图片填充上背景颜色的方法 </a> </li> <li class="rank-item"> <a href="/python-364233.html" title='python语言的编程模式有什么' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">380次</span> <span class="g-sort-num ">8</span> python语言的编程模式有什么 </a> </li> <li class="rank-item"> <a href="/python-353438.html" title='使用python获取进程pid号的方法' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">380次</span> <span class="g-sort-num ">9</span> 使用python获取进程pid号的方法 </a> </li> <li class="rank-item"> <a href="/python-362615.html" title='Python中如何解决无限循环的问题' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">380次</span> <span class="g-sort-num ">10</span> Python中如何解决无限循环的问题 </a> </li> <li class="rank-item"> <a href="/python-466149.html" title='怎么解决pip不是内部或外部命令' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">378次</span> <span class="g-sort-num ">11</span> 怎么解决pip不是内部或外部命令 </a> </li> <li class="rank-item"> <a href="/python-374795.html" title='python中def是什么意思' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">378次</span> <span class="g-sort-num ">12</span> python中def是什么意思 </a> </li> <li class="rank-item"> <a href="/python-361381.html" title='对numpy中数组元素的统一赋值实例' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">376次</span> <span class="g-sort-num ">13</span> 对numpy中数组元素的统一赋值实例 </a> </li> <li class="rank-item"> <a href="/python-378450.html" title='python的选择语句是什么语句' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">374次</span> <span class="g-sort-num ">14</span> python的选择语句是什么语句 </a> </li> <li class="rank-item"> <a href="/python-362375.html" title='Python中构造方法的解析(附示例)' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">374次</span> <span class="g-sort-num ">15</span> Python中构造方法的解析(附示例) </a> </li> <li class="rank-item"> <a href="/python-360729.html" title='关于python中引入导入与自定义模块以及外部文件的实例分享' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">373次</span> <span class="g-sort-num ">16</span> 关于python中引入导入与自定义模块以及外部文件的实例分享 </a> </li> <li class="rank-item"> <a href="/python-364421.html" title='python如何在不同类之间调用方法' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">372次</span> <span class="g-sort-num ">17</span> python如何在不同类之间调用方法 </a> </li> <li class="rank-item"> <a href="/python-462395.html" title='python中的【//】是什么运算符号' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">372次</span> <span class="g-sort-num ">18</span> python中的【//】是什么运算符号 </a> </li> <li class="rank-item"> <a href="/python-363743.html" title='python中╲t是什么' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">371次</span> <span class="g-sort-num ">19</span> python中╲t是什么 </a> </li> <li class="rank-item"> <a href="/python-357501.html" title='python同时给多个变量赋值' class="item-name ellipsis" target="_blank"> <span class="g-art-count fr">371次</span> <span class="g-sort-num ">20</span> python同时给多个变量赋值 </a> </li> </ul> </div> </div> </div> <!-- / 教程内容页 --> </div> </div> <!-- 页尾 --> <div class="footer"> 本站所有资源全部来源于网络,若本站发布的内容侵害到您的隐私或者利益,请联系我们删除!</div> <!-- / 页尾 --> <script type="text/javascript" src="/kan/js/read.js"></script> <div style="display:none"> <div class="login-box" id="login-dialog"> <div class="login-top"><a class="current" rel="nofollow" id="login1" onclick="setTab('login',1,2);" >登录</a></div> <div class="login-form" id="nav-signin"> <!-- <div class="login-ico"><a rel="nofollow" class="qq" id="qqlogin" target="_blank" href="/user-center-qqlogin.html"> QQ </a></div> --> <div class="login-box-form" id="con_login_1"> <form id="loginform" action="/user-center-login.html" method="post" onsubmit="return false;"> <p class="int-text"> <input class="email" id="username" name="username" type="text" value="用户名或Email" onfocus="if(this.value=='用户名或Email'){this.value='';}" onblur="if(this.value==''){this.value='用户名或Email';};" ></p> <p class="int-text"> <input class="password1" type="password" id="password" name="password" value="******" onBlur="if(this.value=='') this.value='******';" onFocus="if(this.value=='******') this.value='';" > </p> <p class="int-info"> <label class="ui-label"> </label> <label for="agreement" class="ui-label-checkbox"> <input type="checkbox" value="" name="cookietime" id="cookietime" checked="checked" value="2592000"> <input type="hidden" name="notforward" id="notforward" value="1"> <input type="hidden" name="dosubmit" id="dosubmit" value="1">记住我的登录 </label> <a rel="nofollow" class="aright" href="/user-center-forgetpwd.html" target="_blank"> 忘记密码? </a></p> <p class="int-btn"><a rel="nofollow" id="loginbt" class="loginbtn"><span>登录</span></a></p> </form> </div> <form id="regform" action="/user-center-reg.html" method="post"> <div class="login-reg" style="display: none;" id="con_login_2"> <input type="hidden" name="t" id="t"/> <p class="int-text"> <input id="email" name="email" type="text" value="Email" onfocus="if(this.value=='Email'){this.value='';}" onblur="if(this.value==''){this.value='Email';};"></p> <p class="int-text"> <input id="uname" name="username" type="text" value="用户名或昵称" onfocus="if(this.value=='用户名或昵称'){this.value='';}" onblur="if(this.value==''){this.value='用户名或昵称';};"></p> <p class="int-text"> <input type="password" id="pwd" name="password" value="******" onBlur="if(this.value=='') this.value='******';" onFocus="if(this.value=='******') this.value='';"> </p> <p class="int-text1"><span class="inputbox"> <input id="validate" name="validate" type="text" value="验证码" onfocus="if(this.value=='验证码'){this.value='';}" onblur="if(this.value==''){this.value='验证码';};"> </span><span class="yzm-img"><img src="/user-checkcode-index" alt="看不清楚换一张" id="indexlogin"></p> <p class="int-info"> <label> <input value="" name="agreement" id="agreement" CHECKED="checked" type="checkbox"> 我已阅读<a rel="nofollow" href="/user-center-agreement.html">用户协议</a>及<a rel="nofollow" href="/user-center-agreement.html">版权声明</a></label> </p> <p class="int-btn"><input type="hidden" name="dosubmit"/> <a rel="nofollow" class="loginbtn" id="register"><span>注册</span></a></p> </div> </form> </div> </div> </div> </div> <script type="text/javascript" src="/kan/js/foot_js.js"></script> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?6dc1c3c5281cf70f49bc0bc860ec24f2"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> <script type="text/javascript" src="/layui/layui.js"></script> <script> layui.use('code', function() { layui.code({ elem: 'pre', //默认值为.layui-code about: false, skin: 'notepad', title: 'php怎么实现数据库验证跳转代码块', encode: true //是否转义html标签。默认不开启 }); }); </script> </body> </html>