618 | 如何用Python脚本实现 京东自动保价

共 10476字,需浏览 21分钟

 ·

2020-06-16 23:23

ff4f67a3aeb0f4fad6d61e95c22d96e7.webp

文 | 某某白米饭
来源:Python 技术「ID: pythonall」


大家在 618 一定买了很多东西,而有些商家喜欢偷偷摸摸降价让我们觉得瞬间亏了一个亿。今天就撸一个京东的自动保价脚本。


一、获取保价列表


首先需要登录京东,这个在 《618!京东PC版抢卷》上写过了,是使用二维码登录的,大家可以看看。

打开京东保价页面(https://pcsitepp-fm.jd.com/),需要获取到下图红框中的元素,有名称,数量,购买价格。

b9244dfc2500d8e19ca6d381d0a55f89.webp

按 F12 获取下页面元素

0b9ddce489ce5eadbd95294e1218ab91.webp

先把全局的变量放在前面

user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

session = requests.session()

下面的代码获取可以保价的订单列表包含订单号和商品的 sku 号和数量,有 3 个函数,get_pin() 函数获取 PIN 值,get_order_list() 函数循环获取订单列表,skuProResultPC() 函数判断这个订单是否超了保价时间


def get_pin():
    """获取 PIN,用正则表达式从页面中取出"""

    url = "https://pcsitepp-fm.jd.com/"
    r = session.get(url)
    loginPin = re.findall('', r.text)
    pin = loginPin[0if len(loginPin) > 0 else None
    return pin

def get_order_list(pin, page_num=1):
    """保价列表"""

    # 存放订单信息
    order_info = []
    # 存放数量
    count_dir = {}

    url = "https://pcsitepp-fm.jd.com/rest/pricepro/priceskusPull"
    data = {"page": page_num, "pageSize"10}
    headers = {
        'User-Agent': user_agent,
        'Referer''https://pcsitepp-fm.jd.com/',
    }
    r = session.post(url, headers= headers, data=data)

    # 订单之间的分隔符
    orders = r.text.split('')
    orders.pop(0)

    for item in orders:
        # 订单号
        orderid = re.findall("订单号:(\d+)", item)
        # 数量
        count = re.findall('\n([\sx\d]+)',item)
        # 商品的 sku和序号
        skuidAndSequences = re.findall("queryOrderSkuPriceParam\.skuidAndSequence\.push\(\"(\d+\,\d+)\"\)\;", item)
        newSkuidAndSequences = []

        # 商品的sku和订单商品的序号
        for ss in skuidAndSequences:

            # 判断订单保价是否超时
            if skuProResultPC(orderid[0], ss.split(',')[0], pin):

                newSkuidAndSequences.append(ss)
                if orderid[0] == '117403228624':
                    print(orderid[0])
                count_ss = count_html[int(ss.split(',')[1]) - 1]
                count = count_ss.replace('\t''').replace('\n''').replace('x''')
                # 把 "订单号_sku" 当做 key
                count_dir[orderid[0] + '_' + ss.split(',')[0]] = count

        if newSkuidAndSequences:

            order_info.append({'orderid': orderid[0], 'skuidAndSequence': newSkuidAndSequences})

    if orders:
        """递归的方式获取所有的商品"""
        bill_info_sub, count_dir_sub = get_order_list(pin, page_num + 1)
        order_info.extend(bill_info_sub)
        count_dir.update(count_dir_sub)
    return order_info, count_dir

def skuProResultPC(orderId, skuId, pin):
    """判断订单是否保价超时"""

    url = "https://sitepp-fm.jd.com/rest/webserver/skuProResultPC"
    data = {
        "orderId": orderId,
        "skuId": skuId,
        "pin": pin
    }
    headers = {
        'User-Agent': user_agent,
        'Referer''https://pcsitepp-fm.jd.com/',
    }

    r = session.post(url, data=data, headers=headers)
    return 'overTime' not in r.text

示例结果

订单信息:
[{'orderid''118598307636''skuidAndSequence': ['851267,1']}, {'orderid''118597642910''skuidAndSequence': ['4389188,1']}, {'orderid''123625659522''skuidAndSequence': ['69699954984,1']}, {'orderid''123539553604''skuidAndSequence': ['6839875,1']}, {'orderid''123474129967''skuidAndSequence': ['50000970588,1']}]
商品数量
{'118598307636_851267''10''118597642910_4389188''10''123625659522_69699954984''1''123539553604_6839875''4''123474129967_50000970588''1''122842702447_31295640649''1''117403228624_31295640649''1'}



二、商品信息


在获取保价列表中,已经取到了商品的 sku 号,在商品 url(如:https://item.jd.com/6839875.html)中最后的数字便是 sku 号,利用 sku 号可以获取到商品信息。

da808134c338d3e5b97bd3d63b54ee9d.webp

分析元素可知在页面的 js 中,pageConfig 变量有我们需要的所有数据,用正则表达式取出

d4bcf2fa607cabcb9d50a1e493ba10ca.webp

def get_product_info(skuId):
    """获商品信息"""
    info = {}
    url = "http://item.jd.com/%s.html" % skuId
    headers = {
        'User-Agent': user_agent,
        'Referer''https://pcsitepp-fm.jd.com/',
    }
    r = requests.get(url, headers=headers)
    pageConfig = re.findall("var pageConfig = \{([\s\S]+)\} catch\(e\) \{\}", r.text)
    cat = re.findall("cat: \[([\d,]+)\]", pageConfig[0])
    venderId = re.findall("venderId:(\d+)", pageConfig[0])
    shopId = re.findall("shopId:'(\d+)'", pageConfig[0])
    name = re.findall("name: '(.+)'", pageConfig[0])
    info['cat'] = cat[0if len(cat) else ""
    info['venderId'] = venderId[0if len(venderId) else ""
    info['shopId'] = shopId[0if len(shopId) else ""
    info['skuId'] = skuId
    # 配送区域默认为北京
    info['area'] = '1_72_55653_0' 
    info['name'] = name[0]
    return info

示例结果

{'cat''1319,1525,7057''venderId''1000015389''shopId''1000015389''skuId''6839875''area''1_72_55653_0''name''雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气'}
{'cat''1319,6313,15614''venderId''10109166''shopId''965779''skuId''50000970588''area''1_72_55653_0''name''七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕'}
{'cat''1319,1527,1559''venderId''107952''shopId''106328''skuId''31295640649''area''1_72_55653_0''name''babycare婴儿纸巾抽纸新生儿面巾纸云柔巾宝宝纸巾 108抽*6包'}



三、商品当前价格


获取到商品信息后,把这些数据当做参数提交到 url(https://c0.3.cn/stock)中获取商品当前的价格。

def get_product_price(product_info):

    url = "https://c0.3.cn/stock?skuId={}&area={}&venderId={}&buyNum=1&choseSuitSkuIds=&cat={}&extraParam={{%22originid%22:%221%22}}&fqsp=0&ch=1&callback=jQuery{}"\
        .format(product_info['skuId'], 
                product_info['area'], 
                product_info['venderId'], 
                product_info.get('cat'''), 
                random.randint(10000009999999))
    headers = {
        'User-Agent': user_agent,
        'Host''c0.3.cn',
        'Referer':  'https://item.jd.com/{0}.html'.format(product_info['skuId']),
    }
    r = session.get(url, headers=headers)
    data = parse_json(r.text)

    # 价格
    price = data.get("stock", {}).get("jdPrice", {}).get('p'0)
    return float(price)




四、商品可用优惠券


在京东购物经常有满 xx 减 xx 和 满 xx 打 xx 折的优惠券,当购买商品时未使用优惠券,可以联系客服进行价格保护,这里抓取优惠券并打印出来

a18070551249bdb125dcc97e90f05467.webp

def get_product_coupon(product_info, price):
    """优惠券列表"""
    result = []
    headers = {
        'User-Agent': user_agent,
        'Referer':  'https://item.jd.com/{0}.html'.format(product_info['skuId']),
    }
    url = 'https://cd.jd.com/promotion/v2?callback=jQuery{}&skuId={}&area={}&shopId={}&venderId={}&cat={}&isCanUseDQ=1&isCanUseJQ=1&platform=0&orgType=2&jdPrice={}&appid=1&_={}'\
        .format(
                str(random.randint(10000009999999)),
                product_info['skuId'],
                product_info['area'],
                product_info['shopId'],
                product_info['venderId'],
                product_info['cat'].replace(',''%2C'),
                price,
                str(int(time.time() * 1000)))
    r = session.get(url, headers=headers)
    data = parse_json(r.text)
    pickOneTag = data.get("prom", {}).get("pickOneTag")

    # 满减
    if pickOneTag:
        for tag in pickOneTag:
            result.append(tag.get('content'))

    # 打折
    skuCoupon = data.get('skuCoupon')
    if skuCoupon:
        for coupon in skuCoupon:
            if coupon.get('allDesc'):
                result.append(coupon.get('allDesc'))
            elif coupon.get('quota'and coupon.get('discount'):
                result.append("满" + str(coupon.get('quota')) + '减' + str(coupon.get('discount')))
    return result

示例结果

['每满199元,可减100元现金,最多可减1000元''满3件,总价打5折''满105.0减5.0']



五、下单价格


到这里已经取到了商品的当前价格、优惠券和购买数量,还剩下订单的下单价格需要获取,这个价格就是第一张图中的金额。我们使用订单号和 sku 号作为参数,批量查询下单价格

18850b04e6e56c8c0b42d86cb38f6876.webp

def get_price_list(pin):
    '''获取下单价格、商品信息、当前价格、数量'''

    product_list = []

    # 取订单号,sku和商品数量
    queryOrderPriceParam,count_dir = get_order_list(pin)

    # 获取购买时的价格
    params = {"queryOrderPriceParam": json.dumps(queryOrderPriceParam)}
    r = session.post("https://sitepp-fm.jd.com/rest/webserver/getOrderListSkuPrice", data = params)
    orderList = r.json()

    for item in orderList:

        skuid = item.get("skuid")
        buyingjdprice = item.get("buyingjdprice")
        orderid = item.get("orderid")

        # 商品信息
        product_info = get_product_info(skuid)
        # 当前价格
        price = get_product_price(product_info)
        # 优惠券
        coupon = get_product_coupon(product_info, price)

        name = product_info['name']
        count = count_dir[orderid + '_' + skuid]

        product_list.append({'orderid': orderid, 'name': name, 'price': price, 'coupon': coupon, 'count': count, 'buyingjdprice': buyingjdprice})
    return product_list

示例结果

[{'orderid': '123539553604', 'name': '雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气', 'price': 27.9, 'coupon': ['购买1件可优惠换购热销商品', '满105.0减5.0', '满199减50', '满268减60'], 'count': '4', 'buyingjdprice': 27.0}, {'orderid': '123474129967', 'name': '七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕', 'price': 69.0, 'coupon': ['06月16日 00:00 该商品参加跨店铺满折活动  ,满2件,总价打8折;满3件,总价打7折', '满98减5', '满105.0减5.0', '满178减10'], 'count': '1', 'buyingjdprice': 66.0}]




六、申请价格保护


最后一步比价和申请价格保护,这里分为 2 种情况,一种是当前不能用优惠券可以直接申请价格保护,另一种是当前存在优惠券,可以打印到控制台通知用户。

def protect_protect_apply(product_list):
    """申请价格保护"""

    if len(product_list) == 0:
        return
    else:
        for item in product_list:
            result = '订单号:{},名称:{}, 数量:{}, 购买价格:{}, 当前价格:{}, 当前优惠:{}。'\
                .format(item['orderid'],
                        item['name'],
                        item['count'],
                        item['buyingjdprice'],
                        item['price'],
                        ' | '.join(item['coupon']))

            # 没有优惠券并且购买价格高于当前价格
            if len(item['coupon']) == 0 and item['buyingjdprice'] > item['price']:

                url = 'https://pcsitepp-fm.jd.com//rest/pricepro/skuProtectApply'
                data = {
                    "orderId": item['orderId'],
                    "orderCategory""Others",
                    "skuId": item['skuId'],
                    "refundtype"1
                }

                headers = {
                    'User-Agent': user_agent,
                    'Referer''https://pcsitepp-fm.jd.com/',
                    'accept''application/json, text/javascript, */*; q=0.01'
                }
                session.post(url, data=data, headers=headers)
                print(result + ' 已申请价格保护,请结果查看价格保护页面')

            elif len(item['coupon']) > 0:
                print(result + ' 在优惠券未申请自动价格保护,请联系客服申请')
    return

示例结果

订单号:123539553604,名称:雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气, 数量:4, 购买价格:27.0, 当前价格:27.9, 当前优惠:购买1件可优惠换购热销商品 | 满105.0减5.0 | 满199减50 | 满268减60。在优惠券未申请自动价格保护,请联系客服申请
订单号:123474129967,名称:七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕, 数量:1, 购买价格:66.0, 当前价格:69.0, 当前优惠:06月16日 00:00 该商品参加跨店铺满折活动 ,满2件,总价打8折;满3件,总价打7折 | 满98减5 | 满105.0减5.0 | 满178减10。在优惠券未申请自动价格保护,请联系客服申请



总结


京东自动保价的脚本核心代码已经完成了,大家可以根据自己的需求更改代码。例如增加计划任务,发送邮件而不是打印等等。

源码:https://github.com/JustDoPython/python-examples/tree/master/moumoubaimifan/jbj


浏览 62
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报