python如何进行菠菜网站请求验证码的data参数加密逻辑分析

发布时间：2021-10-09 16:54:44 作者：柒染
来源：亿速云阅读：215

# Python如何进行菠菜网站请求验证码的data参数加密逻辑分析

## 前言

在网络爬虫和逆向工程领域，菠菜（博彩）网站因其复杂的反爬机制而成为典型的研究对象。其中验证码请求接口的`data`参数加密是常见的技术难点。本文将深入分析如何通过Python逆向这类加密逻辑，涵盖抓包分析、加密定位、算法还原等关键步骤。

---

## 一、环境准备与抓包分析

### 1.1 基础工具准备
- **抓包工具**: Fiddler/Charles/Wireshark
- **浏览器开发者工具**: Chrome DevTools
- **调试工具**: PyCharm/VSCode
- **Python库**: requests, execjs, pyexecjs, hashlib

```python
import requests
from fake_useragent import UserAgent

headers = {
    "User-Agent": UserAgent().random,
    "Referer": "https://example-bocai.com"
}

1.2 关键请求捕获

通过浏览器开发者工具的Network面板，筛选XHR请求，找到验证码请求： - 典型特征：包含captcha、token等关键词 - 观察请求参数结构：

  {
    "timestamp": 1698765432,
    "data": "a1b2c3d4e5...",
    "sign": "md5_encrypted_string"
  }

二、加密参数逆向分析

2.1 定位加密入口

方法1：搜索关键字

在开发者工具的Sources面板全局搜索： - encrypt - JSON.stringify - data:

方法2：XHR断点

在Event Listener Breakpoints中勾选XHR事件，拦截请求生成过程。

2.2 常见加密方式

通过调用栈分析可能存在的加密类型：

加密类型	特征
AES/CBC	出现`CryptoJS.AES.encrypt`
RSA	`setPublicKey`字样
自定义Base64	`btoa()`或自定义字符替换
时间戳哈希	参数包含`timestamp`

三、算法还原实战

3.1 案例：AES加密还原

假设发现如下JS代码：

function encryptData(data) {
    var key = CryptoJS.enc.Utf8.parse("1234567812345678");
    var iv = CryptoJS.enc.Utf8.parse("1234567812345678");
    return CryptoJS.AES.encrypt(JSON.stringify(data), key, {
        iv: iv,
        mode: CryptoJS.mode.CBC,
        padding: CryptoJS.pad.Pkcs7
    }).toString();
}

Python实现：

from Crypto.Cipher import AES
from Crypto.Util.Padding import pad
import json

def aes_encrypt(data):
    key = b'1234567812345678'
    iv = b'1234567812345678'
    cipher = AES.new(key, AES.MODE_CBC, iv)
    return cipher.encrypt(pad(json.dumps(data).encode(), AES.block_size)).hex()

3.2 案例：RSA加密处理

当遇到RSA公钥加密时：

import rsa

def rsa_encrypt(message, pub_key):
    return rsa.encrypt(message.encode(), pub_key).hex()

四、动态参数处理技巧

4.1 时间戳处理

菠菜网站通常要求毫秒级时间戳：

import time

timestamp = int(time.time() * 1000)

4.2 签名算法破解

典型MD5签名示例：

import hashlib

def generate_sign(params, secret):
    param_str = '&'.join([f'{k}={v}' for k,v in sorted(params.items())])
    return hashlib.md5((param_str + secret).encode()).hexdigest()

五、完整请求模拟

5.1 请求示例

def get_captcha():
    url = "https://api.example.com/captcha"
    params = {
        "deviceId": "ABCD-1234",
        "timestamp": int(time.time() * 1000)
    }
    params['sign'] = generate_sign(params, "SECRET_KEY")
    
    response = requests.post(url, json=params, headers=headers)
    return response.json()

5.2 常见反爬对策

TLS指纹绕过：使用curl_cffi库

IP限制：搭配代理池


proxies = {
  "http": "http://user:pass@proxy:port",
  "https": "http://user:pass@proxy:port"
}

六、法律与伦理声明

本文仅用于技术研究学习
禁止用于非法博彩活动
实际商业网站加密可能更复杂
建议在合规范围内测试

结语

通过本文的步骤，可以系统性地完成： 1. 加密入口定位 → 2. 算法逻辑分析 → 3. Python代码还原
遇到更复杂的混淆时，可能需要结合AST语法树分析或wasm逆向技术。建议持续关注WebAssembly等新兴技术的应用。

技术更新日期：2023年10月
声明：所有代码示例均为教学演示，与实际网站无关 “`