暗无天日

=============>DarkSun的个人博客

使用gbkunzip解决linux下zip文件解压乱码问题

由于Windows下的文件名为GBK编码,而linux一般为UTF-8,因此当解压在Windows上生成的zip文件后,会发现解压出来的文件都是乱码的.

网上有个解决方法是使用 unzip-O 选项来指定编码格式,然而不知道为何,我在archlinux下的unzip并没有这个选项.

好在找到了一个 gbkunzip 脚本,可以解决这个问题.

在archlinux上,可以通过yaourt来安装 gbkunzip

yaourt -S gbkunzip

安装后,直接执行 gbkunzip zip文件 就行了.

gbkunzip实际上就是一段python代码,它其实就是对 gbzip module中 ZipFile 类的一个封装.

cat $(whereis gbkunzip |awk '{print $2}')
#!/usr/bin/env python3
# fileencoding=utf-8

'''
解压 zip 文件,其中的文件名是 GB18030 编码,但系统是 Unicode 编码
'''

import sys
import os
from gbzip import ZipFile
from getpass import getpass

def main():
  try:
    z = ZipFile(sys.argv[1])
    while True:
      try:
        z.extractall()
      except RuntimeError: # encrypted zipfile
        passwd = getpass('Enter correct password: ').encode()
        z.setpassword(passwd)
      else:
        break
    print('Everything is ok.')
  except IndexError:
    sys.exit('give me exactly one zipfile to extract.')

if __name__ == '__main__':
  main()