UTF-8文件的BOM头的来由及去除方法

1. 什么是BOM头
    在utf-8编码文件中BOM在文件头部,占用三个字节,用来标识该文件属于utf-8编码,现在已经有很多软件识别BOM头,但还是有些不能识别BOM头,比如PHP就不能识别BOM头,这也就是用记事本编辑utf-8编码的PHP文件后,就会报错的原因。
2. 包含BOM头文件的产生
    在windows环境下,用记事本打开任何一个文本文件,另存为utf-8格式后,这样文件就自动被加上了BOM头信息。
    比较:
            utf-8(含BOM头)
            
            utf-8(不含BOM头)
            
    从上图的比较中,可以很明显的看出,含BOM头的文件多出三个字节 efbbbf。
3. BOM头信息的去除方法
    用Notepad++打开文件,选择 格式 -> 以UTF-8无BOM格式编码,再保存就行。如下图:
    
4. 在PHP类的项目中,自动处理BOM头信息(只需要将此文件放在项目根目录下,从浏览器访问即可)

本文固定链接: http://blog.wmphp.com/1875.html | 顺盛网络博客

该日志由 admin 于2015年05月01日发表在 技术文章 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: UTF-8文件的BOM头的来由及去除方法 | 顺盛网络博客

UTF-8文件的BOM头的来由及去除方法:等您坐沙发呢!

发表评论


快捷键:Ctrl+Enter