java解压缩gzip_利用Java实现压缩与解压缩(zip、gzip)支持中文路径

article/2025/9/21 19:24:06

zip扮演着归档和压缩两个角色;gzip并不将文件归档,仅只是对单个文件进行压缩,所以,在UNIX平台上,命令tar通常用来创建一个档案文件,然后命令gzip来将档案文件压缩。

Java I/O类库还收录了一些能读写压缩格式流的类。要想提供压缩功能,只要把它们包在已有的I/O类的外面就行了。这些类不是Reader和Writer,而是InputStream和OutStreamput的子类。这是因为压缩算法是针对byte而不是字符的。

相关类与接口:

Checksum

接口:被类Adler32和CRC32实现的接口

Adler32

:使用Alder32算法来计算Checksum数目

CRC32

:使用CRC32算法来计算Checksum数目

CheckedInputStream

:InputStream派生类,可得到输入流的校验和Checksum,用于校验数据的完整性

CheckedOutputStream

:OutputStream派生类,可得到输出流的校验和Checksum,

用于校验数据的完整性

DeflaterOutputStream

:压缩类的基类。

ZipOutputStream

:DeflaterOutputStream的一个子类,把数据压缩成Zip文件格式。

GZIPOutputStream

:DeflaterOutputStream的一个子类,把数据压缩成GZip文件格式

InflaterInputStream

:解压缩类的基类

ZipInputStream

:InflaterInputStream的一个子类,能解压缩Zip格式的数据

GZIPInputStream

:InflaterInputStream的一个子类,能解压缩Zip格式的数据

ZipEntry

类:表示 ZIP 文件条目

ZipFile

类:此类用于从 ZIP 文件读取条目

用GZIP进行对单个文件压缩

GZIP的接口比较简单,因此如果你只需对一个流进行压缩的话,可以使用它。当然它可以压缩字符流,与可以压缩字节流,下面是一个对GBK编码格式的文本文件进行压缩的。

压缩类的用法非常简单;只要用GZIPOutputStream 或ZipOutputStream把输出流包起来,再用GZIPInputStream 或ZipInputStream把输入流包起来就行了。剩下的都是些普通的I/O操作。

Java代码  bfdc45f728c843e02fb13a87c62825b3.png

import java.io.BufferedOutputStream;

import java.io.BufferedReader;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.util.zip.GZIPInputStream;

import java.util.zip.GZIPOutputStream;

public class GZIPcompress {

public static void main(String[] args) throws IOException {

//做准备压缩一个字符文件,注,这里的字符文件要是GBK编码方式的

BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(

"e:/tmp/source.txt"), "GBK"));

//使用GZIPOutputStream包装OutputStream流,使其具体压缩特性,最后会生成test.txt.gz压缩包

//并且里面有一个名为test.txt的文件

BufferedOutputStream out = new BufferedOutputStream(new GZIPOutputStream(

new FileOutputStream("test.txt.gz")));

System.out.println("开始写压缩文件...");

int c;

while ((c = in.read()) != -1) {

/*

* 注,这里是压缩一个字符文件,前面是以字符流来读的,不能直接存入c,因为c已是Unicode

* 码,这样会丢掉信息的(当然本身编码格式就不对),所以这里要以GBK来解后再存入。

*/

out.write(String.valueOf((char) c).getBytes("GBK"));

}

in.close();

out.close();

System.out.println("开始读压缩文件...");

//使用GZIPInputStream包装InputStream流,使其具有解压特性

BufferedReader in2 = new BufferedReader(new InputStreamReader(

new GZIPInputStream(new FileInputStream("test.txt.gz")), "GBK"));

String s;

//读取压缩文件里的内容

while ((s = in2.readLine()) != null) {

System.out.println(s);

}

in2.close();

}

}

使用Zip进行多个文件压缩

Java对Zip格式类库支持得比较全面,得用它可以把多个文件压缩成一个压缩包。这个类库使用的是标准Zip格式,所以能与很多的压缩工具兼容。

ZipOutputStream类有设置压缩方法以及在压缩方式下使用的压缩级别,zipOutputStream.setMethod(int

method)设置用于条目的默认压缩方法。只要没有为单个 ZIP

文件条目指定压缩方法,就使用ZipOutputStream所设置的压缩方法来存储,默认值为

ZipOutputStream.DEFLATED(表示进行压缩存储),还可以设置成STORED(表示仅打包归档存储)。

ZipOutputStream在设置了压缩方法为DEFLATED后,我们还可以进一步使用setLevel(int

level)方法来设置压缩级别,压缩级别值为0-9共10个级别(值越大,表示压缩越利害),默认为

Deflater.DEFAULT_COMPRESSION=-1。当然我们也可以通过条目ZipEntry的setMethod方法为单个条件设置压缩

方法。

类ZipEntry描述了存储在ZIP文件中的压缩文件。类中包含有多种方法可以用来设置和获得ZIP条目的信息。类ZipEntry是被

ZipFile[zipFile.getInputStream(ZipEntry

entry)]和ZipInputStream使用来读取ZIP文件,ZipOutputStream来写入ZIP文件的。有以下这些有用的方

法:getName()返回条目名称、isDirectory()如果为目录条目,则返回 true(目录条目定义为其名称以 '/'

结尾的条目)、setMethod(int method) 设置条目的压缩方法,可以为 ZipOutputStream.STORED 或

ZipOutputStream .DEFLATED。

下面实例我们使用了apache的zip工具包(所在包为ant.jar

),因为java类型自带的不支持中文路径,不过两者使用的方式是一样的,只是apache压缩工具多了设置编码方式的接口,其他基本上是一样的。另外,

如果使用org.apache.tools.zip.ZipOutputStream来压缩的话,我们只能使用

org.apache.tools.zip.ZipEntry来解压,而不能使用java.util.zip.ZipInputStream来解压读取

了,当然apache并未提供ZipInputStream类。

Java代码  bfdc45f728c843e02fb13a87c62825b3.png

import java.io.BufferedInputStream;

import java.io.BufferedOutputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.util.Enumeration;

import java.util.zip.CRC32;

import java.util.zip.CheckedInputStream;

import java.util.zip.CheckedOutputStream;

import java.util.zip.Deflater;

import java.util.zip.ZipException;

import java.util.zip.ZipInputStream;

import org.apache.tools.zip.ZipEntry;

import org.apache.tools.zip.ZipFile;

import org.apache.tools.zip.ZipOutputStream;

/**

*

* 提供对单个文件与目录的压缩,并支持是否需要创建压缩源目录、中文路径

*

* @author jzj

*/

public class ZipCompress {

private static boolean isCreateSrcDir = true;//是否创建源目录

/**

* @param args

* @throws IOException

*/

public static void main(String[] args) throws IOException {

String src = "m:/新建文本文档.txt";//指定压缩源,可以是目录或文件

String decompressDir = "e:/tmp/decompress";//解压路径

String archive = "e:/tmp/test.zip";//压缩包路径

String comment = "Java Zip 测试.";//压缩包注释

//----压缩文件或目录

writeByApacheZipOutputStream(src, archive, comment);

/*

* 读压缩文件,注释掉,因为使用的是apache的压缩类,所以使用java类库中

* 解压类时出错,这里不能运行

*/

//readByZipInputStream();

//----使用apace ZipFile读取压缩文件

readByApacheZipFile(archive, decompressDir);

}

public static void writeByApacheZipOutputStream(String src, String archive,

String comment) throws FileNotFoundException, IOException {

//----压缩文件:

FileOutputStream f = new FileOutputStream(archive);

//使用指定校验和创建输出流

CheckedOutputStream csum = new CheckedOutputStream(f, new CRC32());

ZipOutputStream zos = new ZipOutputStream(csum);

//支持中文

zos.setEncoding("GBK");

BufferedOutputStream out = new BufferedOutputStream(zos);

//设置压缩包注释

zos.setComment(comment);

//启用压缩

zos.setMethod(ZipOutputStream.DEFLATED);

//压缩级别为最强压缩,但时间要花得多一点

zos.setLevel(Deflater.BEST_COMPRESSION);

File srcFile = new File(src);

if (!srcFile.exists() || (srcFile.isDirectory() && srcFile.list().length == 0)) {

throw new FileNotFoundException(

"File must exist and  ZIP file must have at least one entry.");

}

//获取压缩源所在父目录

src = src.replaceAll("\\\\", "/");

String prefixDir = null;

if (srcFile.isFile()) {

prefixDir = src.substring(0, src.lastIndexOf("/") + 1);

} else {

prefixDir = (src.replaceAll("/$", "") + "/");

}

//如果不是根目录

if (prefixDir.indexOf("/") != (prefixDir.length() - 1) && isCreateSrcDir) {

prefixDir = prefixDir.replaceAll("[^/]+/$", "");

}

//开始压缩

writeRecursive(zos, out, srcFile, prefixDir);

out.close();

// 注:校验和要在流关闭后才准备,一定要放在流被关闭后使用

System.out.println("Checksum: " + csum.getChecksum().getValue());

BufferedInputStream bi;

}

/**

* 使用 org.apache.tools.zip.ZipFile 解压文件,它与 java 类库中的

* java.util.zip.ZipFile 使用方式是一新的,只不过多了设置编码方式的

* 接口。

*

* 注,apache 没有提供 ZipInputStream 类,所以只能使用它提供的ZipFile

* 来读取压缩文件。

* @param archive 压缩包路径

* @param decompressDir 解压路径

* @throws IOException

* @throws FileNotFoundException

* @throws ZipException

*/

public static void readByApacheZipFile(String archive, String decompressDir)

throws IOException, FileNotFoundException, ZipException {

BufferedInputStream bi;

ZipFile zf = new ZipFile(archive, "GBK");//支持中文

Enumeration e = zf.getEntries();

while (e.hasMoreElements()) {

ZipEntry ze2 = (ZipEntry) e.nextElement();

String entryName = ze2.getName();

String path = decompressDir + "/" + entryName;

if (ze2.isDirectory()) {

System.out.println("正在创建解压目录 - " + entryName);

File decompressDirFile = new File(path);

if (!decompressDirFile.exists()) {

decompressDirFile.mkdirs();

}

} else {

System.out.println("正在创建解压文件 - " + entryName);

String fileDir = path.substring(0, path.lastIndexOf("/"));

File fileDirFile = new File(fileDir);

if (!fileDirFile.exists()) {

fileDirFile.mkdirs();

}

BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(

decompressDir + "/" + entryName));

bi = new BufferedInputStream(zf.getInputStream(ze2));

byte[] readContent = new byte[1024];

int readCount = bi.read(readContent);

while (readCount != -1) {

bos.write(readContent, 0, readCount);

readCount = bi.read(readContent);

}

bos.close();

}

}

zf.close();

}

/**

* 使用 java api 中的 ZipInputStream 类解压文件,但如果压缩时采用了

* org.apache.tools.zip.ZipOutputStream时,而不是 java 类库中的

* java.util.zip.ZipOutputStream时,该方法不能使用,原因就是编码方

* 式不一致导致,运行时会抛如下异常:

* java.lang.IllegalArgumentException

* at java.util.zip.ZipInputStream.getUTF8String(ZipInputStream.java:290)

*

* 当然,如果压缩包使用的是java类库的java.util.zip.ZipOutputStream

* 压缩而成是不会有问题的,但它不支持中文

*

* @param archive 压缩包路径

* @param decompressDir 解压路径

* @throws FileNotFoundException

* @throws IOException

*/

public static void readByZipInputStream(String archive, String decompressDir)

throws FileNotFoundException, IOException {

BufferedInputStream bi;

//----解压文件(ZIP文件的解压缩实质上就是从输入流中读取数据):

System.out.println("开始读压缩文件");

FileInputStream fi = new FileInputStream(archive);

CheckedInputStream csumi = new CheckedInputStream(fi, new CRC32());

ZipInputStream in2 = new ZipInputStream(csumi);

bi = new BufferedInputStream(in2);

java.util.zip.ZipEntry ze;//压缩文件条目

//遍历压缩包中的文件条目

while ((ze = in2.getNextEntry()) != null) {

String entryName = ze.getName();

if (ze.isDirectory()) {

System.out.println("正在创建解压目录 - " + entryName);

File decompressDirFile = new File(decompressDir + "/" + entryName);

if (!decompressDirFile.exists()) {

decompressDirFile.mkdirs();

}

} else {

System.out.println("正在创建解压文件 - " + entryName);

BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(

decompressDir + "/" + entryName));

byte[] buffer = new byte[1024];

int readCount = bi.read(buffer);

while (readCount != -1) {

bos.write(buffer, 0, readCount);

readCount = bi.read(buffer);

}

bos.close();

}

}

bi.close();

System.out.println("Checksum: " + csumi.getChecksum().getValue());

}

/**

* 递归压缩

*

* 使用 org.apache.tools.zip.ZipOutputStream 类进行压缩,它的好处就是支持中文路径,

* 而Java类库中的 java.util.zip.ZipOutputStream 压缩中文文件名时压缩包会出现乱码。

* 使用 apache 中的这个类与 java 类库中的用法是一新的,只是能设置编码方式了。

*

* @param zos

* @param bo

* @param srcFile

* @param prefixDir

* @throws IOException

* @throws FileNotFoundException

*/

private static void writeRecursive(ZipOutputStream zos, BufferedOutputStream bo,

File srcFile, String prefixDir) throws IOException, FileNotFoundException {

ZipEntry zipEntry;

String filePath = srcFile.getAbsolutePath().replaceAll("\\\\", "/").replaceAll(

"//", "/");

if (srcFile.isDirectory()) {

filePath = filePath.replaceAll("/$", "") + "/";

}

String entryName = filePath.replace(prefixDir, "").replaceAll("/$", "");

if (srcFile.isDirectory()) {

if (!"".equals(entryName)) {

System.out.println("正在创建目录 - " + srcFile.getAbsolutePath()

+ "  entryName=" + entryName);

//如果是目录,则需要在写目录后面加上 /

zipEntry = new ZipEntry(entryName + "/");

zos.putNextEntry(zipEntry);

}

File srcFiles[] = srcFile.listFiles();

for (int i = 0; i 

writeRecursive(zos, bo, srcFiles[i], prefixDir);

}

} else {

System.out.println("正在写文件 - " + srcFile.getAbsolutePath() + "  entryName="

+ entryName);

BufferedInputStream bi = new BufferedInputStream(new FileInputStream(srcFile));

//开始写入新的ZIP文件条目并将流定位到条目数据的开始处

zipEntry = new ZipEntry(entryName);

zos.putNextEntry(zipEntry);

byte[] buffer = new byte[1024];

int readCount = bi.read(buffer);

while (readCount != -1) {

bo.write(buffer, 0, readCount);

readCount = bi.read(buffer);

}

//注,在使用缓冲流写压缩文件时,一个条件完后一定要刷新一把,不

//然可能有的内容就会存入到后面条目中去了

bo.flush();

//文件读完后关闭

bi.close();

}

}

}

要想把文件加入压缩包,你必须将ZipEntry对象传给

putNextEntry(

)。ZipEntry是一个接口很复杂的对象,它能让你设置和读取Zip文件里的某条记录的信息,这些信息包括:文件名,压缩前和压缩后的大小,日

期,CRC校验码,附加字段,注释,压缩方法,是否是目录。虽然标准的Zip格式是支持口令的,但是Java的Zip类库却不支持。而且ZipEntry

却只提供了CRC的接口,而CheckedInputStream和CheckedOutputStream却支持Adler32和CRC32两种校验

码。虽然这是底层的Zip格式的限制,但却妨碍了你使用更快的Adler32了。

要想提取文件,可以用ZipInputStream的getNextEntry(

)方法。只要压缩包里还有ZipEntry,它就会把它提取出来。此外还有一个更简洁的办法,你可以用ZipFile对象去读文件。ZipFile有一个

entries()方法,它可以返回ZipEntries的Enumeration。然后通过zipFile.

getInputStream(ZipEntry entry)获取压缩流就可以读取相应条目了。

要想读取校验码,必须先获取Checksum对象。我们这里用的是CheckedOutputStream和CheckedInputStream,不过

你也可以使用Checksum。java.util.zip包中比较重要校验算法类是Adler32和CRC32,它们实现了

java.util.zip.Checksum接口,并估算了压缩数据的校验和(checksum)。在运算速度方面,Adler32算法比CRC32算

法要有一定的优势;但在数据可信度方面,CRC32算法则要更胜一筹。GetValue方法可以用来获得当前的checksum值,reset方法能够重

新设置checksum为其缺省的值。

校验和一般用来校验文件和信息是否正确的传送。举个例子,假设你想创建一个ZIP文件,然后将其传送到远程计算机上。当到达远程计算机后,你就可以使用checksum检验在传输过程中文件是否发生错误,有点像下载文件后我们可以使用哈希值来校验文件下载过程是否出错了。

Zip类里还有一个让人莫名其妙的setComment( )方法。如ZipCompress.java所示,写文件的时候,你可以加注释,但是读文件的时候,ZipInputSream却不提供接口。看来它的注释功能完全是针对条目的,是用ZipEntry实现的。

当然,GZIP和Zip不光能用来压缩文件——它还能压缩任何东西,包括要通过网络传输的数据。

转载:http://jiangzhengjun.iteye.com/blog/517186


http://chatgpt.dhexx.cn/article/iQKI3tbs.shtml

相关文章

ubuntu-20.04 Astra-pro configuration

In function ‘char* strncpy(char*, const char*, size_t)’, inlined from ‘Agent::queryLocalData(std::string&, ResponseDataT&)’ at ./Agent/Agent.cc:715:14: /usr/include/x86_64-linux-gnu/bits/string_fortified.h:106:34: error: ‘char* __builtin_s…

Java中获取本地某一个目录下的所有文件和文件夹

在从事web开发工作中,经常需要对本地某一个目录下的文件进行处理,而在这之前,我们需要做的就是获取到这个目录下的文件。 1 String filepath "D:\file";//D盘下的file文件夹的目录 2 File file new File(filepath);//File类型可以…

企业微信和个人微信的区别

从 个人身份、朋友圈、加好友、社群管理、数据统计,这5个方面来进行对比: 一、 个人身份 企业微信和个人微信有一个很大的区别,就是企业品牌的展示。 企业微信自带一个品牌的小尾巴,当用户初次添加你时,企微自带的品牌…

企业微信or个人微信?三个角度让你不再纠结

如今承载了12亿用户的企业微信已经与微信环境做到高度的融合互通,如实现了互相添加好友等功能,可以看出腾讯推动企业微信扩大商用场景的决心。回想2020年5月某社群工具被封杀后,微信社群运营就一夜回到解放前人工成本高企的状态,那…

安卓移动开发初步——微信页面制作

进行APP门户制作时选择在Android studio中建立简单的微信页面,内容包括: ①页面布局与微信页面基本相似; ②点击图标能实现页面的切换; ③点击图标时有选中效果(图标亮起); 目录 效果图 底部布局实现 顶部布局实现…

微信小程序 java家庭个人收支理财记账本springboot

该系统主要分为登录注册、资金管理、统计报表、趋势图线、个人信息五大模块。 登录管理:新用户填写相关的注册信息,获得登陆账号和密码,已注册用户通过账号和密码登录系统。 资金管理:用户登录到系统后可以通过资金管理对家庭资金进行管理,包…

微信公众号基础入门知识

微信公众号的类型微信公众号一共有四种账号类型,除了我们日常接触的订阅号和服务号外,还包括企业微信和小程序。 订阅号 订阅号主要偏向于为用户传达资讯,其功能类似于报纸杂志,为读者传播消息,每天可以群发一次消息。…

如何零基础创建自己的微信小程序

目录 创建微信小程序 步骤: 1、打开浏览器搜索微信公众平台 2、一般是先要注册的(当然已经有的就不需要了) 3、选择注册的类型 关于“小程序怎么开发自己的小程序”这个不少人关注的问题,小编针对性的给出详细教程,…

微信云托管体验

最近在了解微信云托管,体验了一番,很好用。 我觉得微信云托管是降低了运维的难度,可以不用在购买服务器了,直接使用微信云托管环境很方便。 摘自微信官方文档:微信云托管 是微信团队提供的以云原生为基础的&#xff0…

微信OAuth2.0授权登录

微信OAuth2.0授权登录 OAuth2.0简介OAuth2的应用微服务安全社交登录 网页微信登录前期准备授权流程 服务器端开发需求网页显示二维码返回微信登录参数添加配置添加配置类controller 前端显示登录二维码封装api请求 处理微信回调添加httpclient工具类添加回调接口获取access_tok…

个人申请微信公众号步骤(含截图)

1.打开微信公众平台:https://mp.weixin.qq.com,点击“立即注册” 2.选择“注册账号类型”为“订阅号” 3.填写信息,注意一个邮箱只能注册一次,且后期不能更改。如果你的邮箱之前注册个“微信小程序”账号也是不能用的。 4.点击“…

仿制微信/QQ在线聊天网站

webchat 一款基于Javascriptexpresssocket.io构成的网络在线聊天应用 😚项目仍在维护中,欢迎各位大佬PR🎉和star⭐ 具体效果可以访问http://chat.chuyuxuan.xyz:4400 2020年10月10日前该链接有效,别问为啥,问就是服…

电商卖家做微营销是该做微信个人号还是公众号?

近两年,关于传统企业转型、微营销、社交电商、工业4.0什么的炒作如火如荼,不管是传统企业还是创业团队,无一不关注微信营销。很多线下品牌和电商品牌,都纷纷布局微信营销,或者将微信个人号及公众号作为店铺粉丝和老客户…

Android app集成微信支付

Android app集成微信支付 鉴于微信支付的文档入口不太容易找到、以及文档中有些逻辑不通或者容易产生歧义或者缺失一些信息的情况,记录下此次接入的流程和需要关注的一些点。 使用的是app支付-> APP支付产品介绍 首先阅读介绍等,了解一些基础的概念…

集成微信登录

目录标题 集成微信登录1、OAuth21.1 作用1.2 多方授权的解决方法1.3 OAuth2最简向导1.4 OAuth2的应用 2、微信登录介绍2.1 前期准备2.2 授权流程 3、服务器端开发3.1 返回微信登录参数3.2 前端显示登录二维码3.3 处理微信回调3.4 回调返回页面 集成微信登录 1、OAuth2 1.1 作…

微信数据库解析总结

1.微信数据库解密 微信数据库在在哪个文件夹 EnMicroMsg.db的父文件加密规则是 md5("mm" uin)这样就可以准确的获取到db文件的位置. uin的获取:/data/data/com.tencent.mm/shared_prefs/auth_info_key_prefs.xml里面有个uinz字段,直接获取val…

微信个人公众号推广

作者:余伟峰链接:https://www.zhihu.com/question/34151231/answer/118281456来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 (转) 个人公众号常见的运营和推广可以参考以…

微信小程序云开发|个人博客小程序

🌕文章目录 1.前言2.博客首页数据展示3.使用data中的数据渲染博客展示4.使用云数据库创建集合blogs5.读取数据库中的数据6.创建添加博客页面7.博客添加页面样式设计8.总结 1.前言 这篇文章详细的介绍了个人博客小程序的云开发流程,包括博客展示页面&…

【个人开发】通过企业微信实现消息推送到个人微信

1. 背景 个人有个消息推送到任务,一直在飞书上跑,消息触达率太低,寻思着尝试用一些方法,将消息推送到微信。 2. 写在前面 坑1:寻思着企业微信有机器人,将机器人所在群拉上微信号,结果&#x…

个人开发者实现微信扫码登录

使用码上登录中转微信扫码登录 使用之前最好有一个公网服务器,能够公网访问的 redis 和 mysql 数据库,并且能够部署公网访问的服务 码上登录是一个小程序,对个体开发者提供了免费的微信扫一扫登录入口:官网 http://login.vicy.c…