scrapy 爬虫错误求助

This topic created in 4226 days ago, the information mentioned may be changed or developed.

错误：
ImportError: No module named items

程序：

items.py代码：
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html

from scrapy.item import Item, Field

class XsItem(Item):
# define the fields for your item here like:
# name = Field()
url = Field()

xs.py代码：
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.selector import Selector

from xs.items import XsItem

class XsSpider(CrawlSpider):
name = 'xs'
allowed_domains = ['bbs.uc.cn']
start_urls = ['http://bbs.uc.cn']

rules = (
Rule(SgmlLinkExtractor(allow=('\thread-\d+-\d-\d.html', )),
callback='parse_page', follow=True),
)

def parse_page(self, response):
item = XsItem()
sel = Selector(response)
item['url'] = response.url
return item

item

import

xsitem

6 replies • 2014-11-06 13:58:09 +08:00

Gymgle

Nov 5, 2014

注释掉 xs.py 中的 from xs.items import XsItem 试试

roricon

Nov 5, 2014

贴一下你的目录结构。有__init__.py这个文件么？

llhh

Nov 5, 2014

@roricon 有的。

4mrqn07k

Nov 5, 2014

@llhh 有这个文件，你里面有没有 import xs 呢
没有这个module，就检查一下是名称有没有弄错，如果没有，那结构有没有错
或者执行的目录环境不同也可能有这种问题啊

from xs.items import Xsitem
从你贴的代码看xs是文件，但是xs.items里的xs给人的感觉却像是文件夹名呢
最好还是像2L说的，贴一下目录结构看看

Gymgle

Nov 6, 2014

http://wsky.org/archives/191.html 这里是一个爬取cnbeta新闻的实例

llhh

Nov 6, 2014

@Gymgle 就是按照他的来做的，拿下来成功了。但我的错误。