【python】当当网某分类页面爬虫练习

君哥阅读：12313 3年前评论：457


import requests
from lxml import etree
import csv
import time
import random
import os
os.makedirs('dangdang', exist_ok=True)
writer =csv.writer(open('dangdang/dangdang.csv', 'w', newline='', encoding='utf-8-sig'))
writer.writerow(['图书名称', '上架时间', '出版社', '价格'])

allUrl = ['https://category.dangdang.com/pg{}-cp01.54.92.02.00.00.html'.format(str(i)) for i in range(1, 10)]

count=0

for url in allUrl:
    count = count + 1
    print(url)
    response = requests.get(url)
    response.encoding = 'GB2312'
    html = etree.html(response.text)
    print(html)
    allli = html.xpath('//*[@id="component_59"]/li')
    print(allli)
    print('第{}页开始采集'.format(count))
    for li in allli:
        print(li)
        book_name = li.xpath('./a/@title')[0]
        book_time = li.xpath('./p[5]/span[2]/text()')
        book_pub = li.xpath('./p[5]/span[3]/a/text()')  
        book_price = li.xpath('./p[3]/span[1]/text()')

        if book_time:
            book_time = book_time[0].replace('/','')
        else:
            book_time = '无'

        if book_pub:
            book_pub = book_pub[0] 
        else:
            book_pub = '暂无'

        if book_price:
            book_price = book_price[0].strip('¥')
        else:
            book_price = 0


        rowInfo = (
                   book_name,   
                   book_time,  
                   book_pub,  
                   book_price
                    )
        print(rowInfo)
        writer.writerow(rowInfo)
    print('第{}页采集完成！'.format(count)) 
    time.sleep(random.randint(3, 10))

本文链接：http://www.yanjun202.com/post/89.html

分享到：

标签:css 什么是节流与防抖模板源文件 JavaScript 字符串

发表评论 取消回复

2K电影发表于 8个月前回复

强，我和我的小伙伴们都惊呆了！https://www.2kdy.com

2K影院发表于 8个月前回复

十分赞同楼主！https://www.2kdy.com

2K影院发表于 8个月前回复

不灌水就活不下去了啊！https://www.2kdy.com

helloworld下载发表于 5个月前回复

我回帖楼主给加积分吗？https://www.cn-helloworlds.cn

wps官网发表于 5个月前回复

楼上的说的很多！https://www.org-wps.cn

有道翻译下载发表于 5个月前回复

缺乏激情了！https://www.youdao-fanyi.it.com

wps下载发表于 5个月前回复

最近回了很多帖子，都没人理我！https://pcs-wps.cn

WPS官网发表于 5个月前回复

太高深了，理解力不够用了！https://m-wps.it.com

有道翻译官网发表于 5个月前回复

帖子很有深度！https://win-youdao.it.com

快连VPN官网发表于 5个月前回复

鉴定完毕！https://www.kuailian-vpn.it.com

谷歌浏览器下载发表于 5个月前回复

楼主的等级很高啊！https://www.a-google.com

有道翻译官网发表于 5个月前回复

支持一个https://i-youdao.it.com

有道翻译发表于 5个月前回复

我对楼主的敬仰犹如滔滔江水绵延不绝！https://win-youdao.it.com

wps 发表于 5个月前回复

一口气看完了，我要下去回味回味了！https://www.in-wps.cn

谷歌浏览器官网发表于 5个月前回复

缺乏激情了！https://a-google.com

wps官网下载发表于 5个月前回复

顶顶更健康！https://of-wps.it.com

wps下载发表于 5个月前回复

帖子好乱！https://www.pcs-wps.com.cn

wps官网发表于 5个月前回复

吹牛的人越来越多了！https://www.mace-wps.cn

WPS官网发表于 5个月前回复

论坛人气好旺！https://a-wps.it.com

helloworld 发表于 5个月前回复

论坛的人气不行了！https://www.cn-helloworld.org

1.5trx转账发表于 5个月前回复

波场转账节省手续费 - 1.5 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 1.5 TRX即可0手续费转账!TG机器人:@jzzTRXbot

0.2trx转账发表于 5个月前回复

专业TRON能量租赁平台 - 1.5 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 1.5 TRX即可0手续费转账!TG机器人:@jzzTRXbot

helloworld官网下载发表于 5个月前回复

楼主看起来很有学问！https://www.cm-helloworld.com

谷歌浏览器官网发表于 5个月前回复

勤奋灌水，天天向上！https://www.p-google.com

有道翻译官网发表于 5个月前回复

楼主说的我也略懂！https://www.cn-youdao.it.com

谷歌浏览器官网发表于 5个月前回复

青春不在了，青春痘还在！https://a-google.com

快连VPN 发表于 5个月前回复

看在楼主的面子上，认真回帖！https://kuailianvpn.it.com

有道翻译发表于 5个月前回复

论坛的帖子越来越有深度了！https://win-youdao.it.com

wps官网下载发表于 5个月前回复

有内涵！https://www.im-wps.com.cn

helloworld官网发表于 5个月前回复

好东西，学习学习！https://on-helloworld.it.com

wps下载发表于 5个月前回复

收藏了，很不错的内容！https://wps-on.cn

wps下载发表于 5个月前回复

楼上的真不讲道理！https://to-wps.com.cn

WPS 发表于 5个月前回复

好东西，赞一个！https://m-wps.it.com

wps官网发表于 5个月前回复

看了这么多帖子，第一次看看到这么有内涵的！https://pcs-wps.com

WPS下载发表于 5个月前回复

在这个版块混了这么久了，第一次看见这么给你的帖子！https://zh-wps.it.com

helloworld官网发表于 5个月前回复

有钱、有房、有车，人人都想！https://www.mac-helloworld.net

有道翻译发表于 4个月前回复

有品位！https://i-youdao.it.com

helloworld官网下载发表于 4个月前回复

每次看到楼主的帖子都有惊吓！https://www.me-helloworlds.cn

wps官网下载发表于 4个月前回复

看帖回帖一条路！https://www.in-wps.cn

wps官网发表于 4个月前回复

有品位！https://to-wps.it.com

有道翻译下载发表于 4个月前回复

回帖也有有水平的！https://youdao-zh.it.com

有道翻译官网发表于 4个月前回复

支持一下！https://i-youdao.it.com

wps 发表于 4个月前回复

投楼主一票，不用谢哦！https://www.cm-wps.net

有道翻译发表于 4个月前回复

这里的资源非常丰富，帮助我解决了很多问题。https://www.youdao-fanyi.it.com

usdt转账手续费发表于 4个月前回复

USDT-trc20免费转账 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

能量闪租发表于 4个月前回复

trx租赁 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

快连VPN官网发表于 4个月前回复

楼主今年多大了？https://zh-kuailian.it.com

0.2trx转账发表于 4个月前回复

USDT-trc20免费转账 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

wps 发表于 4个月前回复

最近回了很多帖子，都没人理我！https://wps-it.cn

trx能量机器人发表于 4个月前回复

trx租赁 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

WPS下载发表于 4个月前回复

收藏了，以后可能会用到！https://a-wps.it.com

便宜能量发表于 4个月前回复

usdt转账手续费 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

0.1trx转账发表于 4个月前回复

波场便宜能量 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

0.5trx转账发表于 4个月前回复

?免费转账波场网络的USDT - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

波场转账节省手续费发表于 4个月前回复

trx闪租 - 2 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所,低于 2 TRX的都是钓鱼的骗子- 复制地址【THXfhfV6ThhYzt7d8mm4KL3dE5LWBbwb3s】转 2 TRX即可0手续费转账!TG机器人: @jzzTRXbot 官网: https://jzztrx.com

有道翻译官网发表于 4个月前回复

好好学习楼主的帖子！https://www.youdao-fanyi.it.com

WPS官网发表于 4个月前回复

楼主很有艺术范！https://s-wps.it.com

wps官网下载发表于 4个月前回复

太高深了，理解力不够用了！https://www.im-wps.com.cn

helloworld官网下载发表于 4个月前回复

听楼主一席话，省我十本书！https://to-helloworld.com

有道翻译发表于 4个月前回复

最近回了很多帖子，都没人理我！https://win-youdao.it.com

helloworld官网发表于 4个月前回复

我回帖楼主给加积分吗？https://www.mace-helloworlds.net

WPS 发表于 4个月前回复

网页的加载速度非常快，不会影响用户体验。https://s-wps.it.com

WPS下载发表于 4个月前回复

观点鲜明，立场坚定，作者态度明确。https://zh-wps.it.com

快连VPN下载发表于 4个月前回复

刚分手，心情不好！https://zh-kuailian.it.com

helloworld官网下载发表于 4个月前回复

楼主今年多大了？https://co-helloworld.net

搜狗官网发表于 4个月前回复

读了楼主的帖子，顿时马桶就通了。。。https://im-sogou.com

helloworld官网发表于 4个月前回复

没人理我，好伤心啊！https://www.web-helloworlds.cn

有道翻译发表于 4个月前回复

楼主主机很热情啊！https://i-youdao.com.cn

wps下载发表于 4个月前回复

每天顶顶贴，一身轻松啊！https://www-wps-cn.com

有道翻译官网发表于 4个月前回复

这么经典的话只有楼主能想到！https://i-youdao.com.cn

有道翻译下载发表于 4个月前回复

楼主英明！https://i-youdao.com.cn

trx能量租赁发表于 4个月前回复

波场能量 - 1.5 TRX=1次转账次数直接节省80%!无视对方有没有U或者是否交易所- 复制地址【TWzHTvfWZrraadP2VwKZRi3X14aAedKSC4】转 1.5 TRX即可0手续费转账!TG机器人:@nengliang_robot

helloworld下载发表于 4个月前回复

刚看见一个妹子，很漂亮！https://www.vip-helloworld.cn

helloworld下载发表于 4个月前回复

读了楼主的帖子，顿时马桶就通了。。。https://top-helloworld.com

有道翻译官网发表于 4个月前回复

楼上的能详细介绍一下么？https://i-youdao.com.cn

helloworld 发表于 4个月前回复

看了这么多帖子，第一次看到这么高质量内容！https://www.mace-helloworlds.org

WPS 发表于 4个月前回复

顶顶更健康！https://www.zh-wps.it.com

WPS 发表于 4个月前回复

缺乏激情了！https://www-wps-cn.com

有道翻译官网发表于 4个月前回复

我默默的回帖，从不声张！https://i-youdao.com.cn

波场能量租赁发表于 4个月前回复

trx能量转错【 TP85KPGg4fWyZAh6ApbnZT9tTX88888888 】转错请联系TG:@TrxEm

trx能量租赁发表于 4个月前回复

欧意转u转错地址怎么找回【 TPbp5LCvJuPeRv4TBKpQrpq6oVtYVfqFw8 】转错请联系TG:@TrxEm

trx能量租赁发表于 4个月前回复

u转错省能量地址【 TN7DrFpdAEk1s3Yhgj2pdia3ZieoqGX7qV 】转错请联系TG:@TrxEm

波场能量租赁发表于 4个月前回复

u转错地址能否找回【 TGwCj7vCTDCmp8z2gmmGxexjy7EiozF2HR 】转错请联系TG:@TrxEm

波场能量租赁发表于 4个月前回复

转trx能量转错u怎么办【 TVQeMHsquWVRbBqJtu28LvHnD8EpDdLXgb 】转错请联系TG:@TrxEm

trx能量机器人发表于 4个月前回复

转USDT转错【 TGdUzBwaPksEUAp9ESChLskzV9KFZF6D37 】转错请联系TG:@TrxEm

trx能量机器人发表于 4个月前回复

u币转错地址退回案例【 TM8NYsKHpW6nQNrB3xLBnRhpCsakWjH1DY 】转错请联系TG:@TrxEm

波场能量租赁发表于 4个月前回复

比特派u转错地址【 TSyV8Y5bafHUszWWdxnzsz2XbSFeu8Rhqw 】转错请联系TG:@TrxEm

trx能量机器人发表于 4个月前回复

转错u地址怎么才能挽回【 TQ1pEBDYUg13H2Re4gKg9H5cvbtess8bai 】转错请联系TG:@TrxEm

波场能量租赁发表于 3个月前回复

转错u地址怎么才能挽回【 THWfospamoRVNmPw6csqnzvRFqRowsZdgv 】转错请联系TG:@TrxEm

波场能量租赁发表于 3个月前回复

u转错地址能否找回【 TADokuJ95NH32YwfgxxgU84tpCwpupqqXo 】转错请联系TG:@TrxEm

trx能量机器人发表于 3个月前回复

u币转错地址退回案例【 TT8vZxbWZXGVtaSVBwUabHvu21bBE1mNA4 】转错请联系TG:@TrxEm

trx能量机器人发表于 3个月前回复

转trx能量转错u怎么办【 THHaz364nnPcZAQvmFJHiSVUM5VmKt6t1d 】转错请联系TG:@TrxEm

波场能量租赁发表于 3个月前回复

u地址转错网络咋办【 TK4XWsbNrKy9ivS7KJACim5JnUZDvuNtcK 】转错请联系TG:@TrxEm

节省TRX手续费发表于 3个月前回复

u地址转错【 TCcMevwt1hLhbp7Th9XrTBFcrzGetY231f 】转错请联系TG:@TrxEm

节省TRX手续费发表于 3个月前回复

u地址转错【 TXQ6ejLmJuptqNvRDTFuC8GFzamWeCscLb 】转错请联系TG:@TrxEm

trx能量机器人发表于 3个月前回复

u地址转错【 TK4XWsbNrKy9ivS7KJACim5JnUZDvuNtcK 】转错请联系TG:@TrxEm

节省TRX手续费发表于 3个月前回复

u地址转错【 TR2Ke7haUCqXjjPFwEHaSoZEBSmXkZX6uG 】转错请联系TG:@TrxEm

节省TRX手续费发表于 3个月前回复

u地址转错【 TQFLu92T57ZhX1ELLFnFwhDmUfpWwC5AiQ 】转错请联系TG:@TrxEm

trx能量机器人发表于 3个月前回复

u地址转错【 TSuSqoMRXkEXcXGT6qLM7eNmwMV6666666 】转错请联系TG:@TrxEm

波场能量租赁发表于 3个月前回复

u地址转错【 TSHycLrShs133YK5PoeB1LCKwQmnzNGPuM 】转错请联系TG:@TrxEm

1 2 3 4 5 › ››

前端君哥

【python】当当网某分类页面爬虫练习