欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

BOM是什么?php读取文本文件把bom读入数组的情况分析

程序员文章站 2022-11-28 12:18:09
###file()函数读取utf8 的文本文件 会把bom读入 数组。导致mysql搜索 不到内容 可以对读取后的字符 $result = trim($result, "\xef\xbb\...

###file()函数读取utf8 的文本文件 会把bom读入 数组。导致mysql搜索 不到内容

可以对读取后的字符 $result = trim($result, "\xef\xbb\xbf");

1.什么是bom?

bom是用来判断文本文件是哪一种unicode编码的标记,其本身是一个unicode字符("\ufeff"),位于文本文件头部。

在不同的unicode编码中,对应的bom的二进制字节如下:

bytes encoding

fe ff utf16be

ff fe utf16le

ef bb bf utf8

所以我们可以根据文件头部的几个字节和上面的表格对应来判断该文件是哪种编码形式。