python+flask怎样搭建CNN在线识别手写中文网站

发布时间：2021-12-10 17:24:09 作者：柒染
来源：亿速云阅读：308

Python+Flask怎样搭建CNN在线识别手写中文网站

在本文中，我们将探讨如何使用Python和Flask框架搭建一个基于卷积神经网络（CNN）的在线手写中文识别网站。我们将从环境搭建、模型训练、Flask应用开发到部署的整个过程进行详细讲解。

1. 环境搭建

首先，我们需要准备开发环境。确保你已经安装了Python 3.x版本，并且安装了以下必要的库：

pip install flask tensorflow keras numpy pillow

Flask: 用于构建Web应用。
TensorFlow/Keras: 用于构建和训练CNN模型。
NumPy: 用于数值计算。
Pillow: 用于图像处理。

2. 数据集准备

手写中文识别需要大量的手写汉字数据集。常用的数据集有CASIA-HWDB（中科院手写汉字数据库）等。你可以从相关网站下载数据集，并将其转换为适合训练的格式。

假设我们已经有了一个预处理好的数据集，包含图像和对应的标签。

3. 构建CNN模型

接下来，我们使用Keras构建一个简单的CNN模型。以下是一个基本的CNN模型示例：

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

def build_model(input_shape, num_classes):
    model = Sequential()
    
    model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    
    model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(num_classes, activation='softmax'))
    
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    
    return model

在这个模型中，我们使用了两个卷积层和两个池化层，然后通过全连接层进行分类。

4. 训练模型

在构建好模型后，我们需要对模型进行训练。假设我们已经将数据集加载为X_train, y_train, X_test, y_test。

from tensorflow.keras.utils import to_categorical

# 假设输入图像大小为64x64，类别数为100
input_shape = (64, 64, 1)
num_classes = 100

# 将标签转换为one-hot编码
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

# 构建模型
model = build_model(input_shape, num_classes)

# 训练模型
model.fit(X_train, y_train, batch_size=128, epochs=10, validation_data=(X_test, y_test))

训练完成后，我们可以保存模型以便后续使用：

model.save('handwritten_chinese_model.h5')

5. 构建Flask应用

接下来，我们使用Flask构建一个简单的Web应用，允许用户上传手写汉字图片并进行识别。

首先，创建一个基本的Flask应用结构：

my_flask_app/
│
├── app.py
├── templates/
│   └── index.html
└── static/
    └── uploads/

5.1 `app.py`

在app.py中，我们编写Flask应用的主要逻辑：

from flask import Flask, render_template, request, redirect, url_for
import numpy as np
from tensorflow.keras.models import load_model
from PIL import Image
import os

app = Flask(__name__)
app.config['UPLOAD_FOLDER'] = 'static/uploads/'

# 加载模型
model = load_model('handwritten_chinese_model.h5')

def preprocess_image(image_path):
    img = Image.open(image_path).convert('L')  # 转换为灰度图像
    img = img.resize((64, 64))  # 调整大小为64x64
    img = np.array(img) / 255.0  # 归一化
    img = np.expand_dims(img, axis=0)  # 增加批次维度
    img = np.expand_dims(img, axis=-1)  # 增加通道维度
    return img

@app.route('/', methods=['GET', 'POST'])
def index():
    if request.method == 'POST':
        if 'file' not in request.files:
            return redirect(request.url)
        file = request.files['file']
        if file.filename == '':
            return redirect(request.url)
        if file:
            file_path = os.path.join(app.config['UPLOAD_FOLDER'], file.filename)
            file.save(file_path)
            img = preprocess_image(file_path)
            prediction = model.predict(img)
            predicted_class = np.argmax(prediction, axis=1)[0]
            return render_template('index.html', prediction=predicted_class, image_url=file_path)
    return render_template('index.html')

if __name__ == '__main__':
    app.run(debug=True)

5.2 `templates/index.html`

在templates/index.html中，我们创建一个简单的HTML页面，允许用户上传图片并显示识别结果：

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>手写中文识别</title>
</head>
<body>
    <h1>手写中文识别</h1>
    <form method="POST" enctype="multipart/form-data">
        <input type="file" name="file">
        <input type="submit" value="上传并识别">
    </form>
    
    {% if prediction %}
    <h2>识别结果: {{ prediction }}</h2>
    <img src="{{ image_url }}" alt="Uploaded Image">
    {% endif %}
</body>
</html>

6. 运行和部署

在完成上述步骤后，我们可以通过以下命令运行Flask应用：

python app.py

应用将在本地运行，并可以通过浏览器访问http://127.0.0.1:5000/。

如果你希望将应用部署到生产环境，可以考虑使用Gunicorn和Nginx进行部署。

7. 总结

通过本文，我们学习了如何使用Python和Flask搭建一个基于CNN的在线手写中文识别网站。我们从环境搭建、模型训练、Flask应用开发到部署的整个过程进行了详细讲解。希望这篇文章能帮助你快速上手并构建自己的手写中文识别应用。