暗无天日

=============>DarkSun的个人博客

使用file命令识别文件字符编码格式

今天才知道 file 命令有一个 --mime-encoding 选项可以检测文本文件的字符编码格式:

file --mime-encoding ~/我的GTD/home.org
/home/lujun9972/我的GTD/home.org: utf-8

可惜的是,经过测试,发现这个检测的失误率有些高啊~~

比如检查GBK就会认错

iconv -f utf-8 -t GBK ~/我的GTD/home.org -o /tmp/home.org
file --mime-encoding /tmp/home.org
/tmp/home.org: iso-8859-1

再试试AS400的编码

iconv -f utf-8 -t IBM1388 ~/我的GTD/home.org -o /tmp/home.org
file --mime-encoding /tmp/home.org
/tmp/home.org: binary

直接就不认为是文本文件了...