java解析utf-8文件

论坛 期权论坛 编程之家     
选择匿名的用户   2021-6-2 17:17   1692   0

解析utf-8格式的文件时,注意有读取第一个字符串进行比较时可能会出现两个字符串看起来相同,但是equals结果为false的情况。

原因:utf-8有两种格式

1)有签名(前三个字节为BOM)所以读取字符串时应该注意这三个字节的存在,应该使用字节流先看一先前面三个字节。

2)无签名 可以按照正常的方式解析


分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP