上一主题下一主题
关键字
主题 : 爬虫没有爬出内容啊?
级别: 北风技术菜鸟


UID: 478713
精华: 0
发帖: 1235
威望: 5434 点
学点: 1346 点
贡献: 188 点
好评: 0 点
学币: 19 个
注册时间: 2014-07-23
最后登录: 2015-04-02
楼主  发表于: 2015-02-09 01:19||

爬虫没有爬出内容啊?

item.py ac&tpvij  
&FanD   
-*- coding: utf-8 -* ohh 1DsB  
import scrapy RZ.5:v6  
class BokeItem(scrapy.Item): a,tP.Xsl  
    url=scrapy.Field() 6a,YxR\  
    title=scrapy.Field() TMRXl.1  
    content=scrapy.Field() -zTeIvcy5  
boke_spider.py ^Ta"Uk'  
<St`"H  
-*- coding: utf-8 -*- @O(\ TIg  
from scrapy.contrib.spiders import CrawlSpider ,Rule ~gAx  
from scrapy.contrib.linkextractors import LinkExtractor v]1rH$  
from boke.items import BokeItem bIhL!Ty T.  
d8K^`k+x  
class BokeItem(CrawlSpider): Av[jFk  
    name = 'blog' ]Lh\[@#1f  
    start_urls =['http://blog.sina.com.cn/s/blog_4701280b0102eo83.html'] bC{~/ JP  
5u8Sxfm",  
    def parse_torrent(self,response): ["7}u^z@<+  
        torrent=BokeItem() LSs={RD2+p  
        torrent['url']=response.url .6hH}BM  
        torrent['title']=response.xpath("//h2[@class='titName SG_txta']/text()").extract()[0] 8 , =$>@u  
        torrent['content']=response.xpath("//div[@style='min-height:22px']/text()").extract()[0] <eI;Jph5  
        return  torrent
此帖悬赏中(剩余时间:已结束)...
最佳答案: 2 学点
热心助人剩余点数: 1 学点
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
沙发(1楼)  发表于: 2015-02-09 01:24||

试试去看看官方doc
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
板凳(2楼)  发表于: 2015-02-09 01:24||

试试看看这个博客,专门针对scrapy
级别: 北风资深评论员


UID: 478710
精华: 0
发帖: 4520
威望: 6415 点
学点: 7638 点
贡献: 199 点
好评: 0 点
学币: 119 个
注册时间: 2014-07-23
最后登录: 2015-04-06
地板(3楼)  发表于: 2015-02-09 01:24||

from scrapy.contrib.spiders import CrawlSpider ,Rule VF?<{F  
Jk7|{W\OA  
你调用的是CrawlSpider类,但是显然没有写任何的规则 LBM ^9W  
8ZM&(Lz7u  
建议改为Spider类,并将parse_torrent改名为parse,如下: E"qRw_ ~t  
wO'T BP  
from scrapy.contrib.spiders import Spider ,z;cbsV-{  
from boke.items import BokeItem /fZe WU0W  
class BokeItem(Spider):