上一主题下一主题
关键字
主题 : 爬虫没有爬出内容啊?
级别: 北风技术菜鸟


UID: 478713
精华: 0
发帖: 1235
威望: 5434 点
学点: 1346 点
贡献: 188 点
好评: 0 点
学币: 19 个
注册时间: 2014-07-23
最后登录: 2015-04-02
楼主  发表于: 2015-02-09 01:19||

爬虫没有爬出内容啊?

item.py iA[WDB\|0  
NpIx\\d  
-*- coding: utf-8 -* HYkZMVH{  
import scrapy /`j~r;S  
class BokeItem(scrapy.Item): :$#"; t|  
    url=scrapy.Field() 6UkX?I`>  
    title=scrapy.Field() #el i_Cxe  
    content=scrapy.Field() ~e)`D nJ  
boke_spider.py {{\ d5CkX  
#CaT0#v  
-*- coding: utf-8 -*- 9Fkzt=(E~  
from scrapy.contrib.spiders import CrawlSpider ,Rule Y lY3C  
from scrapy.contrib.linkextractors import LinkExtractor }Z~& XL=  
from boke.items import BokeItem Z\`i~  
;3D[[*n9  
class BokeItem(CrawlSpider): e"sz jY~V  
    name = 'blog' v/Z!Wp1LV  
    start_urls =['http://blog.sina.com.cn/s/blog_4701280b0102eo83.html'] >c~ Fg s  
&mM[q 'V  
    def parse_torrent(self,response): h zh%ML3L  
        torrent=BokeItem() sKkk+-J4  
        torrent['url']=response.url m),3J4(q  
        torrent['title']=response.xpath("//h2[@class='titName SG_txta']/text()").extract()[0] w<3g1n7R  
        torrent['content']=response.xpath("//div[@style='min-height:22px']/text()").extract()[0] Vko1{$}t  
        return  torrent
此帖悬赏中(剩余时间:已结束)...
最佳答案: 2 学点
热心助人剩余点数: 1 学点
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
沙发(1楼)  发表于: 2015-02-09 01:24||

试试去看看官方doc
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
板凳(2楼)  发表于: 2015-02-09 01:24||

试试看看这个博客,专门针对scrapy
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
地板(3楼)  发表于: 2015-02-09 01:24||

from scrapy.contrib.spiders import CrawlSpider ,Rule 5=_bK^Am  
#w@V!o  
你调用的是CrawlSpider类,但是显然没有写任何的规则 )uu(I5St  
E?- ~*T  
建议改为Spider类,并将parse_torrent改名为parse,如下: 5=&ME(fmV  
%uw7sGz\  
from scrapy.contrib.spiders import Spider bae;2| w  
from boke.items import BokeItem =m;,?("7t3  
class BokeItem(Spider):