C#字符串处理中Unicode和UTF-8怎么用 - 问答

在C#中，Unicode和UTF-8都是用来表示字符编码的方式。Unicode是一种字符集，定义了每个字符对应的唯一代码点，而UTF-8是一种编码方式，用来将Unicode字符编码为字节序列。

在C#中，可以使用Encoding.Unicode和Encoding.UTF8类来进行Unicode和UTF-8编码的转换。下面是一个示例代码：

using System;
using System.Text;

class Program
{
    static void Main()
    {
        string unicodeString = "你好";
        
        // 将Unicode字符串编码为UTF-8字节序列
        byte[] utf8Bytes = Encoding.UTF8.GetBytes(unicodeString);
        Console.WriteLine("UTF-8 bytes: " + BitConverter.ToString(utf8Bytes));

        // 将UTF-8字节序列解码为Unicode字符串
        string decodedString = Encoding.UTF8.GetString(utf8Bytes);
        Console.WriteLine("Decoded string: " + decodedString);
    }
}

在上面的示例中，我们首先将Unicode字符串"你好"编码为UTF-8字节序列，然后将UTF-8字节序列解码为Unicode字符串。可以看到，通过使用Encoding.UTF8类，我们可以方便地进行Unicode和UTF-8之间的转换。

0 赞

1 踩