UTF-8格式编码的文件分为带BOM和不带BOM

原创
2014/12/01 16:09
阅读数 543

Notepad++支持“UTF-8无BOM格式”和“UTF-8带BOM格式”两种UTF-8。一直以来不知道两者有什么区别。

它们的区别是:UTF-8带BOM格式,就是在文件头添加了3个bits的b'\xef\xbb\xbf'字符。

一般编程,特别是Linux下编程建议使用“UTF-8无BOM格式“,这种不含BOM的UTF-8才是标准形式,因为含有BOM的UTF-8经常和Linux戏常用的#!冲突。

如果是在windows下编程,建议使用”UTF-8带BOM格式“,这样比较好!

其实,现在只有微软还在坚持使用带BOM格式的UTF-8,因为它便于较快的与很多本地编码,如gbk,ascii相区分。总之,微软为了向前兼容性,一直坚持使用带BOM格式的UTF-8。

作为一个程序员,必须十分注意!!!

展开阅读全文
加载中

作者的其它热门文章

打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部