.NET Core怎么使用C#扫描并读取图片中的文字

发布时间：2021-12-27 14:26:59 作者：iii
来源：亿速云阅读：824

# .NET Core怎么使用C#扫描并读取图片中的文字

## 引言

在当今数字化时代，光学字符识别（OCR）技术已成为从图像中提取文本信息的重要手段。无论是扫描文档、识别车牌还是处理照片中的文字，OCR都能发挥关键作用。本文将详细介绍如何在.NET Core中使用C#实现图片文字的扫描与读取。

## 准备工作

### 1. 环境要求
- .NET Core 3.1或更高版本
- Visual Studio 2019/2022或VS Code
- NuGet包管理器

### 2. 安装必要的NuGet包
推荐使用以下OCR库：
```bash
Install-Package Tesseract
Install-Package System.Drawing.Common

实现步骤

1. 创建.NET Core项目

dotnet new console -n OcrDemo
cd OcrDemo

2. 添加Tesseract OCR引擎

Tesseract是一个开源的OCR引擎，支持多种语言：

using Tesseract;
using System.Drawing;

var tessDataPath = @"tessdata"; // 训练数据路径
var imagePath = @"sample.png";

using (var engine = new TesseractEngine(tessDataPath, "eng", EngineMode.Default))
{
    using (var img = Pix.LoadFromFile(imagePath))
    {
        using (var page = engine.Process(img))
        {
            Console.WriteLine("识别结果：");
            Console.WriteLine(page.GetText());
            Console.WriteLine($"置信度: {page.GetMeanConfidence()}");
        }
    }
}

3. 处理不同格式的图片

支持PNG、JPG等常见格式：

Bitmap ToBitmap(byte[] imageBytes)
{
    using (var ms = new MemoryStream(imageBytes))
    {
        return new Bitmap(ms);
    }
}

4. 提高识别准确率的技巧

图像预处理

Bitmap PreprocessImage(Bitmap original)
{
    // 转换为灰度图
    var grayScale = new Bitmap(original.Width, original.Height);
    using (var g = Graphics.FromImage(grayScale))
    {
        var colorMatrix = new ColorMatrix(new float[][] 
        {
            new float[] {.3f, .3f, .3f, 0, 0},
            new float[] {.59f, .59f, .59f, 0, 0},
            new float[] {.11f, .11f, .11f, 0, 0},
            new float[] {0, 0, 0, 1, 0},
            new float[] {0, 0, 0, 0, 1}
        });
        
        using (var attributes = new ImageAttributes())
        {
            attributes.SetColorMatrix(colorMatrix);
            g.DrawImage(original, new Rectangle(0, 0, original.Width, original.Height),
                0, 0, original.Width, original.Height, GraphicsUnit.Pixel, attributes);
        }
    }
    return grayScale;
}

设置识别参数

using (var page = engine.Process(img, PageSegMode.Auto))
{
    // 获取逐行文本
    using (var iter = page.GetIterator())
    {
        iter.Begin();
        do {
            Console.WriteLine(iter.GetText(PageIteratorLevel.TextLine));
        } while (iter.Next(PageIteratorLevel.TextLine));
    }
}

5. 多语言支持

下载对应语言的训练数据（.traineddata文件）到tessdata目录：

// 使用中文识别
var engine = new TesseractEngine(tessdataPath, "chi_sim", EngineMode.Default);

完整示例代码

using System;
using Tesseract;
using System.Drawing;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        const string tessDataPath = @"./tessdata";
        const string imagePath = "invoice.jpg";
        
        try 
        {
            using (var engine = new TesseractEngine(tessDataPath, "eng+chi_sim", EngineMode.LstmOnly))
            {
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    using (var page = engine.Process(img, PageSegMode.Auto))
                    {
                        Console.WriteLine("识别结果：");
                        Console.WriteLine(page.GetText());
                        
                        Console.WriteLine("\n置信度统计：");
                        Console.WriteLine($"平均置信度: {page.GetMeanConfidence():P0}");
                    }
                }
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"错误: {ex.Message}");
        }
    }
}

性能优化建议

批量处理：对于多张图片，复用Tesseract引擎实例
区域识别：指定ROI(Region of Interest)减少处理范围
并行处理：使用Parallel.ForEach处理大量图片
GPU加速：考虑使用支持GPU的OCR引擎

替代方案

Azure Cognitive Services

var client = new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
{
    Endpoint = endpoint
};
var results = await client.RecognizePrintedTextInStreamAsync(true, imageStream);

Google Cloud Vision

结语

通过本文介绍的方法，您可以在.NET Core应用中轻松集成OCR功能。实际应用中建议： - 根据场景选择合适的OCR引擎 - 对图像进行适当的预处理 - 处理异常情况和边缘案例

注意事项：Tesseract对训练数据有依赖，商业应用需注意AGPL许可证限制。生产环境建议考虑商业OCR解决方案。

扩展阅读： - Tesseract文档 - .NET System.Drawing最佳实践 “`

（全文约1280字，可根据需要调整具体细节）