文件编码格式检测

上传文本文件,自动检测编码格式(UTF-8/GBK/Shift-JIS 等),支持转换为 UTF-8

点击或拖拽文本文件到此处
支持 .txt / .csv / .log / .xml / .html / .json 等文本文件
关于文件编码格式检测
  • 通过分析文件的字节序列特征(BOM 标记、字节分布规律)推断文件编码格式
  • 支持检测 UTF-8、UTF-16、GBK/GB2312、Shift-JIS、ISO-8859-1 等常见编码
  • 检测到编码后可一键转换为 UTF-8 并下载,解决乱码问题
操作说明
  • 点击「上传文件」或拖拽文件到上传区域,工具自动检测编码
  • 检测完成后,点击「转换为 UTF-8」可将文件转换并下载
  • 文件预览区显示文件前500字节的内容,帮助判断是否乱码
注意事项
  • 编码检测基于统计算法,置信度低于 70% 时结果仅供参考,建议手动确认
  • 纯 ASCII 文件(只含英文和数字)无法区分编码,通常显示为 UTF-8
  • 二进制文件(图片、PDF 等)不适合用此工具检测
  • 所有处理均在浏览器本地完成,文件不会上传服务器
字符编码知识详解
常见编码格式对比
编码BOM 标记中文支持适用场景
UTF-8EF BB BF(可选)✅ 3字节/字Web、跨平台(推荐)
UTF-16 LEFF FE✅ 2字节/字Windows 内部、Java
GBK/GB2312✅ 2字节/字中文 Windows 系统
Shift-JIS日文 Windows 系统
ISO-8859-1西欧语言
乱码排查指南
  • 中文显示为问号(???):文件是 GBK 编码,但被当作 UTF-8 读取,用本工具转换为 UTF-8
  • 中文显示为乱码(如 ÃÃ):文件是 UTF-8,但被当作 GBK/Latin-1 读取
  • 文件开头有 BOM 导致解析错误:使用「转换为 UTF-8(无 BOM)」选项
  • Excel 打开 CSV 乱码:将 CSV 转换为 GBK 编码,或在 Excel 中使用「数据→从文本/CSV」导入并指定编码