程序员scholar 程序员scholar
首页
  • Java 基础

    • JavaSE
    • JavaIO
    • JavaAPI速查
  • Java 高级

    • JUC
    • JVM
    • Java新特性
    • 设计模式
  • Web 开发

    • Servlet
    • Java网络编程
  • Web 标准

    • HTML
    • CSS
    • JavaScript
  • 前端框架

    • Vue2
    • Vue3
    • Vue3 + TS
    • 微信小程序
    • uni-app
  • 工具与库

    • jQuery
    • Ajax
    • Axios
    • Webpack
    • Vuex
    • WebSocket
    • 第三方登录
  • 后端与语言扩展

    • ES6
    • Typescript
    • node.js
  • Element-UI
  • Apache ECharts
  • 数据结构
  • HTTP协议
  • HTTPS协议
  • 计算机网络
  • Linux常用命令
  • Windows常用命令
  • SQL数据库

    • MySQL
    • MySQL速查
  • NoSQL数据库

    • Redis
    • ElasticSearch
  • 数据库

    • MyBatis
    • MyBatis-Plus
  • 消息中间件

    • RabbitMQ
  • 服务器

    • Nginx
  • Spring框架

    • Spring6
    • SpringMVC
    • SpringBoot
    • SpringSecurity
  • SpringCould微服务

    • SpringCloud基础
    • 微服务之DDD架构思想
  • 日常必备

    • 开发常用工具包
    • Hutoll工具包
    • IDEA常用配置
    • 开发笔记
    • 日常记录
    • 项目部署
    • 网站导航
    • 产品学习
    • 英语学习
  • 代码管理

    • Maven
    • Git教程
    • Git小乌龟教程
  • 运维工具

    • Docker
    • Jenkins
    • Kubernetes
  • 算法笔记

    • 算法思想
    • 刷题笔记
  • 面试问题常见

    • 十大经典排序算法
    • 面试常见问题集锦
关于
GitHub (opens new window)
首页
  • Java 基础

    • JavaSE
    • JavaIO
    • JavaAPI速查
  • Java 高级

    • JUC
    • JVM
    • Java新特性
    • 设计模式
  • Web 开发

    • Servlet
    • Java网络编程
  • Web 标准

    • HTML
    • CSS
    • JavaScript
  • 前端框架

    • Vue2
    • Vue3
    • Vue3 + TS
    • 微信小程序
    • uni-app
  • 工具与库

    • jQuery
    • Ajax
    • Axios
    • Webpack
    • Vuex
    • WebSocket
    • 第三方登录
  • 后端与语言扩展

    • ES6
    • Typescript
    • node.js
  • Element-UI
  • Apache ECharts
  • 数据结构
  • HTTP协议
  • HTTPS协议
  • 计算机网络
  • Linux常用命令
  • Windows常用命令
  • SQL数据库

    • MySQL
    • MySQL速查
  • NoSQL数据库

    • Redis
    • ElasticSearch
  • 数据库

    • MyBatis
    • MyBatis-Plus
  • 消息中间件

    • RabbitMQ
  • 服务器

    • Nginx
  • Spring框架

    • Spring6
    • SpringMVC
    • SpringBoot
    • SpringSecurity
  • SpringCould微服务

    • SpringCloud基础
    • 微服务之DDD架构思想
  • 日常必备

    • 开发常用工具包
    • Hutoll工具包
    • IDEA常用配置
    • 开发笔记
    • 日常记录
    • 项目部署
    • 网站导航
    • 产品学习
    • 英语学习
  • 代码管理

    • Maven
    • Git教程
    • Git小乌龟教程
  • 运维工具

    • Docker
    • Jenkins
    • Kubernetes
  • 算法笔记

    • 算法思想
    • 刷题笔记
  • 面试问题常见

    • 十大经典排序算法
    • 面试常见问题集锦
关于
GitHub (opens new window)
npm

(进入注册为作者充电)

  • 快速入门

  • 克隆

  • 类型转换

  • 日期时间

  • IO流相关

  • 工具类

    • 字符串工具 - `StrUtil`
    • 16进制工具 - `HexUtil`
    • 转义工具 - `EscapeUtil`
    • Hash算法工具 - `HashUtil`
    • URL 工具类 - `URLUtil`
    • XML 工具类 - `XmlUtil`
    • 对象工具类 - `ObjectUtil`
    • 反射工具类 - `ReflectUtil`
    • 泛型类型工具类 - `TypeUtil`
    • 分页工具类 - `PageUtil`
    • 剪贴板工具类 - `ClipboardUtil`
    • 类处理工具类 - `ClassUtil`
    • 枚举工具类 - `EnumUtil`
    • 命令行工具类 - `RuntimeUtil`
    • 数字工具类 - `NumberUtil`
    • 数组工具类 - `ArrayUtil`
    • 随机工具类 - `RandomUtil`
    • 唯一ID工具类 - `IdUtil`
    • 压缩工具类 - `ZipUtil`
    • 引用工具 - `ReferenceUtil`
    • 正则工具 - `ReUtil`
    • 身份证工具 - `IdcardUtil`
    • 信息脱敏工具 - `DesensitizedUtil`
    • 社会信用代码工具 - `CreditCodeUtil`
    • SPI 加载工具 - `ServiceLoaderUtil`
    • 字符编码工具 - `CharsetUtil`
      • 1. 常量定义
      • 2. 编码字符串转换为 Charset 对象
      • 3. 编码转换
      • 4. 获取系统默认编码
    • 类加载工具 - `ClassLoaderUtil`
  • 语言特性

  • JavaBean

  • 集合类

  • Map

  • Codec编码

  • 文本操作

  • 注解

  • 比较器

  • 异常

  • 数学

  • 线程和并发

  • 图片

  • 网络

  • 源码编译

  • 配置文件

  • 日志

  • 缓存

  • JSON

  • 加密解密

  • DFA查找

  • HTTP客户端

  • 定时任务

  • 扩展

  • 切面

  • 脚本

  • Office文档操作

  • 系统调用

  • 图形验证码

  • 网络Socket

  • JWT

  • Hutoll
  • 工具类
scholar
2024-08-20
目录

字符编码工具 - CharsetUtil

# 字符编码工具 - CharsetUtil

简介

CharsetUtil 是 Hutool 提供的一个针对编码操作的工具类,它简化了字符编码相关的操作,并且封装了一些常用的编码常量,方便在开发过程中直接引用,提升编码效率和代码可读性。

# 1. 常量定义

CharsetUtil 提供了字符串形式和 Charset 对象形式的常量,便于在编码转换和处理时直接使用。

import cn.hutool.core.util.CharsetUtil;

public class CharsetUtilExample {
    public static void main(String[] args) {
        // 字符串形式的常量
        String utf8 = CharsetUtil.UTF_8;
        String gbk = CharsetUtil.GBK;

        // Charset 对象形式的常量
        Charset charsetUtf8 = CharsetUtil.CHARSET_UTF_8;
        Charset charsetGbk = CharsetUtil.CHARSET_GBK;

        System.out.println("字符串形式 UTF-8: " + utf8); // 输出: UTF-8
        System.out.println("Charset 对象 UTF-8: " + charsetUtf8); // 输出: UTF-8
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
  • 字符串形式的常量:

    • CharsetUtil.ISO_8859_1
    • CharsetUtil.UTF_8
    • CharsetUtil.GBK
  • Charset 对象形式的常量:

    • CharsetUtil.CHARSET_ISO_8859_1
    • CharsetUtil.CHARSET_UTF_8
    • CharsetUtil.CHARSET_GBK

作用: 在编码转换和处理时,直接引用这些常量,避免编码名称拼写错误,提高代码可读性。

实际开发场景: 在处理文件读写、网络传输、字符串编码转换时,通常需要指定编码格式,可以使用这些常量进行统一管理。

# 2. 编码字符串转换为 Charset 对象

charset 方法用于将编码形式的字符串转换为 Charset 对象。如果传入的编码名称无效,默认返回 UTF-8 编码。

import cn.hutool.core.util.CharsetUtil;
import java.nio.charset.Charset;

public class CharsetUtilExample {
    public static void main(String[] args) {
        // 将编码字符串转为 Charset 对象
        Charset charset = CharsetUtil.charset("GBK");
        System.out.println("Charset 对象: " + charset); // 输出: GBK

        // 使用无效编码名,返回默认编码 UTF-8
        Charset invalidCharset = CharsetUtil.charset("INVALID_ENCODING");
        System.out.println("无效编码的默认 Charset 对象: " + invalidCharset); // 输出: UTF-8
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
  • charset(String charsetName):将编码名称转换为 Charset 对象。
    • charsetName:编码名称,例如 "UTF-8"、"GBK" 等。
    • 返回值:转换后的 Charset 对象,如果编码名称无效,则返回 UTF-8。

作用: 方便地将字符串形式的编码名称转换为 Charset 对象,适用于需要动态指定编码的场景。

实际开发场景: 在处理字符串或文件读写时,如果编码格式是动态传入的,可以使用该方法将其转换为 Charset 对象。

# 3. 编码转换

convert 方法用于在不同编码之间转换字符串,常用于解决因为编码识别错误而导致的乱码问题。

import cn.hutool.core.util.CharsetUtil;

public class CharsetUtilExample {
    public static void main(String[] args) {
        // 假设我们读取了一个 GBK 编码的文件,错误地按 UTF-8 解析,导致出现乱码
        String content = "错误编码的字符串";

        // 使用 convert 方法进行编码转换,从 UTF-8 转换为 GBK
        String convertedContent = CharsetUtil.convert(content, CharsetUtil.UTF_8, CharsetUtil.GBK);
        System.out.println("转换后的字符串: " + convertedContent);
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
  • convert(String source, String srcCharset, String destCharset):在不同编码之间转换字符串。
    • source:要转换的字符串。
    • srcCharset:原始编码格式。
    • destCharset:目标编码格式。
    • 返回值:转换后的字符串。

作用: 在出现编码错误导致的乱码时,可以通过该方法进行编码转换,恢复正确的字符串内容。

实际开发场景: 在读取文件、网络传输数据时,如果出现了编码错误导致的乱码问题,可以使用该方法进行修复。

# 4. 获取系统默认编码

defaultCharset 方法是 Charset.defaultCharset() 的封装,返回系统默认的编码格式。defaultCharsetName 方法则返回编码名称字符串。

import cn.hutool.core.util.CharsetUtil;

public class CharsetUtilExample {
    public static void main(String[] args) {
        // 获取系统默认编码
        String defaultCharsetName = CharsetUtil.defaultCharsetName();
        System.out.println("系统默认编码: " + defaultCharsetName); // 例如:UTF-8

        // 获取系统默认的 Charset 对象
        Charset defaultCharset = CharsetUtil.defaultCharset();
        System.out.println("系统默认 Charset 对象: " + defaultCharset); // 例如:UTF-8
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
  • defaultCharset():返回系统默认的 Charset 对象。
  • defaultCharsetName():返回系统默认编码的名称字符串。

作用: 快速获取系统的默认编码,适用于处理本地文件读写、网络通信等场景。

实际开发场景: 在处理需要与系统默认编码一致的文本或文件时,可以使用这些方法获取编码信息。

总结

CharsetUtil 是一个便捷的字符编码处理工具类,提供了常用的编码常量、编码转换和系统默认编码获取方法。无论是在编码纠错、编码转换,还是在文件和网络数据处理过程中,它都能帮助开发者快速、准确地进行编码相关操作。

编辑此页 (opens new window)
上次更新: 2024/12/28, 18:32:08
SPI 加载工具 - `ServiceLoaderUtil`
类加载工具 - `ClassLoaderUtil`

← SPI 加载工具 - `ServiceLoaderUtil` 类加载工具 - `ClassLoaderUtil`→

Theme by Vdoing | Copyright © 2019-2025 程序员scholar
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式