当前位置：赤蜂网 > 淘宝>正文

淘宝抢购秒杀器是真的吗「快速抢购淘宝秒杀技巧」

店小二整理
2024-06-22 12:11:02

【温馨提示】本文共有4092个字，预计阅读完需要11分钟，请仔细阅读哦！

淘宝抢购秒杀器是真的吗「快速抢购淘宝秒杀技巧」

使用Selenium爬取淘宝商品（绕过登录页面）

用Selenium来模拟浏览器操作，抓取淘宝商品信息，并将结果保存到MongoDB。

1.准备工作

本文以Chrome为例来讲解Selenium的用法。在开始之前，请确保已经正确安装好了Chrome浏览器并配置好了ChromeDriver；另外，还需要正确安装Python的Selenium库。

2.接口分析

首先，我们来打开淘宝的接口，观察一下它的ajax请求。

打开淘宝页面，搜索商品，比如ipad，此时打开开发者工具，查看Ajax请求，我们可以发现，根本没有Ajax请求，如图

不过没有关系，我们可以直接用Selenium来模拟浏览器，只要在浏览器里能看到的，都可以爬取。这也是我们选择使用Selenium的原因。

3.页面分析

我们的目标是爬取商品信息。如图是一个商品条目，其中包含商品的基本信息，包括商品图片、名称、价格、购买人数、店铺名称和店铺所在地，我们要做的就是将这些信息都抓取下来。

抓取入口就是淘宝的搜索页面，这个链接可以通过直接构造参数访问。例如，如果搜ipad，就可以直接访问https://s.taobao.com/search?q=ipad，呈现的就是第一页的搜索结果，如图所示

在页面下方，有一个分页导航，其中既包括前5页的链接，也包括下一个的链接，同时还有一个输入任意页码跳转的链接，如图

这里商品搜索的结果一般最大都是100页，要获取每一页的内容，只需要将页码从1到100顺序遍历即可，页码数是确定的。所以，直接在页面跳转文本框中输入要跳转的页码，然后点击“确定”按钮即可跳转到页码对应的页面。

这里不直接点击“下一页”的原因是：一旦爬取过程中出现异常退出，比如到50页退出了，此时点击“下一页”时，就无法快速切换到对应的后续页面了。此外，在爬取过程中，也需要记录当前的页码数，而且点击“下一页”之后页面加载失败，还需要做异常检测，检测当前页面是加载到了第几页。整个流程比较复杂，所以我们这里直接用跳转的方式来爬取页面。

当我们成功的加载出某一页商品列表时，利用Selenium即可获取页面源代码，然后再用相应的解析库解析即可。这里我们选用pyquery解析。下面我们用代码实现整个抓取过程。

4.获取商品列表

首先，需要构造一个抓取的URL：https://s.taobao.com/search?q=ipad。这个URL非常简洁，参数q就是要搜索的关键字。只要改变这个参数，即可获取不同的商品列表。这里我们将商品的关键字定义成一个变量，然后构造出这样的一个URL。

然后就需要用Selenium进行抓取了。我们实现了如下抓取列表页的方法：

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
from urllib.parse import quote
import time
browser = webdriver.Chrome()
wait = WebDriverWait(browser,10)
KEYWORD = 'ipad'
def index_page(page):
    """
    抓取索引页
    :param page: 页码
    """
    print('正在爬取第',page,'页')
    try:
        url = 'https://s.taobao.com/search?q='+quote(KEYWORD)
        browser.get(url)
        if page>1:
            input = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#mainsrp-pager p.form > input')))
            submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'#mainsrp-pager p.form > span.btn.J_Submit')))
            input.clear()
            input.send_keys(page)
            submit.click()
        wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,'#mainsrp-pager li.item.active > span'),str(page)))
        wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'.m-itemlist .items .item')))
        get_products()
    except TimeoutException:
        index_page(page)

这里首先构造了一个WebDriver对象，使用的浏览器是Chrome，然后指定一个关键词，如ipad，接着定义了index_age()方法，用于抓取商品列表页。

在该方法里，我们首先访问了搜索商品的链接，然后判断了当前的页码，如果大于1，就进行跳页操作，否则等待页面加载完成。

等待加载时，我们使用了WebDriverWait对象，它可以指定等待条件，同时指定一个最长等待时间，这里指定为10s。如果在这个时间内成功匹配了等待条件，也就是说页面元素成功加载出来了，就立即返回相应结果并继续向下执行，否则到了最大等待时间还没有加载出来时，就直接抛出超时异常。

比如，我们最终要等待商品信息加载出来，就指定了presnece_of_element_located这个条件，然后传入了.m-itemlist .items .item这个选择器，而这个选择器对应的页面内容就是每个商品的信息块，可以在网页中查看。如果加载成功，就会执行后续的get_products()方法，提取商品信息。

关于翻页操作，这里首先获取页码输入框，赋值为input，然后获取“确定”按钮，赋值为submit，分别是图中的两个元素。

首先，我们清空了输入框，此时调用clear（）方法即可。随后，调用send_keys()方法将页码填充到输入框中，然后点击“确定按钮即可”

那么，怎么样知道有没有跳转到对应的页码呢？我们可以注意到，成功跳转到某一页后，页码都会高亮显示，如图

我们只需要判断当前高亮的页码数是当前的页码数即可，所以这里使用了另一个等待条件text_to_be_present_in_element，它会等待指定的文本出现在某一个节点里面时即返回成功。这里我们将高亮的页码节点对应的CSS选择器和当前要跳转的页码通过参数传递给这个等待条件，这样它就会检测当前高亮的页码节点是不是我们传过来的页码数，如果是，就证明页面成功跳转到了这一页，页面跳转成功。

这样刚才实现的index_page()方法就可以传入对应的页码，待加载出对应页码的商品列表后，再去调用get_products()方法进行页面解析。

5.解析商品列表

接下来，我们就可以实现get_products()方法来解析商品列表了。这里我们直接获取页面源代码，然后用pyquery进行解析，实现如下：

from pyquery import PyQuery as pq
def get_products():
    """
    提取商品数据
    """
    html = browser.page_source
    doc = pq(html)
    items = doc('#mainsrp-itemlist .items .item').items()
    for item in items:
        product = {
            'image':item.find('.pic .img').attr('data-src'),
            'price':item.find('.price').text(),
            'deal':item.find('.deal-cnt').text(),
            'title':item.find('.title').text(),
            'shop':item.find('.shop').text(),
            'location':item.find('.location').text()
        }
        print(product)
        save_to_mongo(product)

首先，调用page_source属性获取页码的源代码，然后构造了PyQuery对象，提取了商品列表，此时使用的CSS选择器是#mainsrp-itemlist .items .item，它会匹配整个页面的每个商品。它的匹配结果是多个，所以这里我们又对它进行了一次遍历，用for循环将每个结果分别进行解析，每次循环把它赋值为item变量，每个item变量都是一个PyQuery对象，然后再调用它的find()方法，传入CSS选择器，就可以获取单个商品的特定内容。

比如查看一下商品源码

可以发现，它是一个img节点，包含id、class、data-src、alt和src属性，这里之所以可以看到这样图片，是因为它的src属性被赋值为图片的URL。把它的src属性提取出来，就可以获取商品的完整图片了。不过我们还注意data-src属性，它的图片内容也是图片的URL，观察后发现此URL是图片的完整大图，而src是压缩后的小图，所以这里抓取data-src属性来作为商品的图片。

因此，我们需要先利用find()方法找到图片的这个节点，然后再调用attr()方法获取商品的data-src属性，这样就成功提取了商品的链接。然后用同样的方法提取商品的价格、成交量、名称、店铺所在地等信息，接着将所有提取结果赋值为一个字典product，然后调用save_mongo()将其保存到MongoDB即可。

6.保存到MongoDB

接下来，我们将商品信息保存到MongoDB，代码如下：

import pymongo
MONGO_URL = 'localhost'
MONGO_DB = 'taobao'
MONGO_COLLECTION = 'products'
client = pymongo.MongoClient(MONGO_URL)
db = client[MONGO_DB]
def save_to_mongo(result):
    """
    保存结果到MongoDB
    """
    try:
        if db[MONGO_COLLECTION].insert(result):
            print('存储到MongoDB成功')
    except Exception:
        print('存储到MongoDB失败')

这里首先创建了一个MongoDB的连接对象，然后指定了数据库，随后指定了Collection的名称，接着调用insert()方法将数据库插入到MongoDB。此处的result的变量就是在get_products()方法里传来的product，包含单个商品的信息。

7.遍历每页

刚才我们所定义的get_index()方法需要接收参数page，page代码页码。这里我们实现页码遍历即可，代码如下：

MAX_PAGE = 10
def main():
    """
    遍历
    :return:
    """
    for i in range(1,MAX_PAGE+1):
        index_page(i)
        time.sleep(10)
main()

最后调用main()方法即可运行。

8.异常处理（绕过登录反爬机制）

当写到这里，如果运行程序会发现，程序在弹出浏览器窗口后，会出现登陆页面，但是当你尝试输入账户密码时，滑块的验证始终失效。并且页面还会不断刷新。如图

针对这种情况，博主找到了两种解决方案

方法一：修改ChromeDriver.exe

之所以出现这种情况，是因为在淘宝的登录页面，有这样一个js，它会判断你是通过驱动打开的浏览器还是其他情况，如果是驱动打开那么这个判断为真就会出现这种情况，如图，为判断的js

我们在控制台运行一下这个脚本window.navigator.webdriver

可以看到，判断为真，说明浏览器知道我们使用的是驱动。

那该如何解决呢？

首先，使用nodepad++或者记事本打开chrome，查找$cdc，找到这串代码后，将其用等长的字符串替代即可，例如把最后的l改成a。

然后把部分代码改为如下模式，将浏览器设置为开发者模式：

option = webdriver.ChromeOptions()
#开发者模式的开关，设置一下，打开浏览器就不会识别为自动化测试工具了
option.add_experimental_option('excludeSwitches', ['enable-automation'])
driver = webdriver.Chrome(chrome_options=option)

如果这种方法不能奏效，请看第二种方法

方法二：将用户信息的配置文件在代码中加载

首先，在Chrome中输入chrome://version/查看信息。如图，这是我们用户信息。

然后在代码中，加载浏览器配置

chrome_option = webdriver.ChromeOptions()
p=r'C:Users赵磊AppDataLocalGoogleChromeUser Data'
#chrome_option.add_experimental_option('excludeSwitches', ['enable-automation'])  # 以开发者模式
chrome_option.add_argument('--user-data-dir='+p)
browser = webdriver.Chrome(options=chrome_option)
wait = WebDriverWait(browser,10)

这样在爬取时就不会出现登录页面了。

9.运行

此时运行代码，会发现弹出一个Chrome浏览器，然后会访问淘宝页面，接着控制台输出如下

可以发现，这些商品信息的结果都是字典形式，它们倍存储到MongoDB里面，再看一下MongoDB中的结果

说明信息保存到MongoDB中，爬取成功。

使用Selenium自动秒抢淘宝商品

selenium有多种编程语言的客户端驱动，编写自动化脚本语法简洁，其中python的selenium库便非常的受欢迎。

你可以使用selenium做web测试或者爬虫，自动抢票、自动下单也可以用selenium来做。

演示自动打开淘宝网：

使用selenium抢购商品

导入selenium相关模块

# 导入库from selenium import webdriverimport datetimeimport time

打开chrome浏览器

# 记录时间now = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')# 打开chrome browser = webdriver.Chrome()

登录淘宝

# 登录def login():    # 打开淘宝首页，通过扫码登录    browser.get("https://www.taobao.com/")    time.sleep(3)    # 打开登录界面    find_login = browser.find_element_by_link_text("亲，请登录")    if find_login:        find_login.click()        print("请扫码登录")        time.sleep(10)        login()

选择购物车列表

# 选择购物车列表def picking(method):    # 是否全选购物车    if method == 0:        while True:            try:                if browser.find_element_by_id("J_SelectAll1"):                    browser.find_element_by_id("J_SelectAll1").click()                    print('全选购物车成功')                    break            except:                print(f"找不到购买按钮")    else:        print(f"请手动勾选需要购买的商品")        time.sleep(1)

点击结算按钮

# 点击结算按钮def settlement():    while True:        try:            if browser.find_element_by_id('J_SelectedItemsCount').text >= '1':                browser.find_element_by_link_text("结 算").click()                print(f"结算成功，准备提交订单")                break        except:            pass

点击提交订单按钮

# 点击提交订单按钮def submitting():    while True:        try:            if browser.find_element_by_link_text('提交订单'):                browser.find_element_by_link_text('提交订单').click()                print(f"抢购成功，请尽快付款")                break        except:            print(f"再次尝试提交订单")

开始执行抢购

def run(times):    # 打开购物车列表页面    print('正在抢购！')    browser.get("https://cart.taobao.com/cart.htm")    time.sleep(3)    while True:        now = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')        # 对比时间，时间到的话就点击结算        if now > times:            # 全选购物车            picking(0)            # 点击结算按钮            settlement()            # 提交订单            submitting()            print(now)            break

希望本文对你有所帮助~~

【进阶知识】

淘宝如何自己装修设计「最新店铺装修教程」

我们的店铺和详情页都是一样的，店铺的门面很重要，好的店铺门面可以更好地吸引到顾客，而不好的呢，也就没有顾客能看上，所以店铺的门面是一个重要的一个点，也是可以店铺的点击率和收藏的。

首先我们进入淘宝，在卖家中心左栏找到店铺管理下的店铺装修项目，点击进入接下来可以看到页面管理、布局管理等这些页面的修饰。

我们可以看到这些装饰包括基础页面，宝贝详情页面，宝贝列表页面。我们可以根据自己的要求编辑各个模块，点击各个模板的装修页面进行装修。我们可以设置商店招牌、图片旋转木马等。

店招是我们店铺的展示的最好地方，在装修的过程中，一定要发挥它的重要性，把店铺的核心内容在这里展现出来，把自己产品的优势放出来。

这些优势可以通过价格、产品质量、服务的对比来展示，让顾客一进店就看到我们的优势，这样的店招是可以给我们带来宏观的浏览量和转化率的。

那么我们做店铺的门面的时候主要是要体验店铺的核心内容，激发并放大顾客的购物欲望。

之后就是店铺的色彩搭配了，就是搭配店铺的整体色彩。

颜色是指淘宝店铺的主色调，和辅色调，店铺的主色调离不开产品的属性，主色一旦确定，其他颜色的应用必须与主色高度协调。

同一页中的颜色不能超过三种颜色，有些人喜欢把店铺弄得五彩缤纷，充满闪烁，表面上看起来有些缤纷，但是在客户的眼里就是一顿瞎配，是留不住客户的，颜色弄太多会让客户有些沉默。

那么最后总的来说呢，我们做店铺装修呢，主要是为了能够吸引到顾客，从而带来流量那些的，而不是跟过家家一样，想装修成什么样就装修成什么样的，我们最后还是要以产品为中心，要突出产品。

所以最后的话店铺装修也是要认真去做，先去确定店铺的风格，之后突出产品，还有色调的合理搭配，等等这些。

淘宝天天特价一元秒杀是真的吗「特价版天天一元购技巧」

淘宝聚划算秒杀在哪「聚划算整点秒杀小技巧」

淘宝今日秒杀入口不见了「淘宝秒杀最准的时间」

双十一哪个软件便宜点「淘宝抢购秒杀软件app」

不能加购物车的商品怎么秒杀「淘宝秒杀抢购技巧」

【本文标题和网址】淘宝抢购秒杀器是真的吗「快速抢购淘宝秒杀技巧」 http://www.cftyj.cn/taobao/2024062253275.html
内容更新时间（UpDate）： 2024年06月22日星期六

淘宝抢购秒杀器是真的吗「快速抢购淘宝秒杀技巧」

淘宝抢购秒杀器是真的吗「快速抢购淘宝秒杀技巧」

使用Selenium爬取淘宝商品（绕过登录页面）

1.准备工作

2.接口分析

3.页面分析

4.获取商品列表

5.解析商品列表

6.保存到MongoDB

7.遍历每页

8.异常处理（绕过登录反爬机制）

方法一：修改ChromeDriver.exe

方法二：将用户信息的配置文件在代码中加载

9.运行

使用Selenium自动秒抢淘宝商品

使用selenium抢购商品

淘宝如何自己装修设计「最新店铺装修教程」

猜你喜欢

最新文章

推荐阅读

怎么在淘宝抢东西最快抢到「手动上架的商品抢购技巧」

淘宝哪家童装店质量好又便宜「淘宝童装品牌排行榜」

淘宝如何领取发票流程「网购快速申请电子发票的技巧」

淘宝推荐怎么点亮爱心「淘宝爱心好店设置方法」

淘宝显示不正常怎么办「淘宝网页面显示不正常的原因」

淘宝导购标题怎么填「导购标题的写法技巧」

热门知识

淘宝卖家秒杀活动怎么设置「淘宝秒杀最准的时间」

淘宝网站优惠券是真的吗「分享淘宝优惠券app介绍」

淘宝女装有哪些比较好的品牌「淘宝最火的女装店推荐」

淘宝向你求助怎么删除「处理淘宝问题的方式」

卖淘宝店铺会不会犯法「网店转让存在的安全隐患」