火绒安全软件

标题: ZIP、RAR、7Z——压缩率大比拼 [打印本页]

作者: 小龙哥    时间: 2023-9-5 15:57
标题: ZIP、RAR、7Z——压缩率大比拼
ZIP、RAR、7Z,哪个压缩格式能把同一个文件压到最小?如何挑选合适的压缩方式?什么文件不适合压缩?我花了几天时间整理了一张表,希望能帮助到大家。

[attach]103013[/attach]


1 压缩率统计一图流

[attach]103014[/attach]


2 压缩率统计可视化


压缩率:从中,我们可以看到,极限压缩的7Z的压缩效果最好,默认设置ZIP的压缩效果最差。

文件格式:纯文本类型(txt,log等)压缩率可压得很低,PDF具有压缩的价值,Word文档、Excel、PPT、图片、音频、视频不适合用压缩软件压缩。

提高压缩率的方法:
一、Win RAR:在同一个压缩格式下,通过设置字典大小、单词大小和固实大小,有时也会产生截然不同的效果。对于包含各个格式的6000个文件、大小仅为16.5M的文件夹,将压缩方式设为“最好”,字典大小1G,创建固实压缩文件后,压缩率相比默认设置削了一半,所需的压缩时间大约是原来的2倍。

[attach]103015[/attach]


3 WIN RAR极限压缩设置


二、7-Zip:同一个文件夹,在电脑内存16G的情况下选择9级极限压缩、1.5G字典、273单词、固实,相比1级7Z压缩率降低5%,但是压缩时间要多3倍以上。压缩时间:1级7Z<默认设置RAR<极限RAR<极限7Z。

[attach]103016[/attach]

4 7-Zip极限压缩设置

软件推荐:
一、因为本次测试是针对压缩率而非压缩软件,使用的软件只有Win RAR和7-Zip,所以无法给出软件推荐。
二、但需要知道,无论是Win RAR、7-Zip、快压还是52好压,在同一压缩方法、加密算法、字典大小、单词大小和固实大小的压缩下,不同压缩软件的压缩效果并无差别。由于不同压缩软件默认设置不同,会造成“这个压软的压缩效果好”的假象。
三、在安装包的压缩中,RAR压缩后比原文件大,这是因为安装包本身无法压缩,而RAR会创建额外的空间实现自动修复功能,如果压缩文件损坏不严重,可以恢复原文件,而其他压缩格式哪怕只损坏几百字节,整个文件就GG了。



——————以下为测试文件详情——————

小文件:16.5MB,含6000各个格式文件的文件夹。
大文本:达梦数据库256M的LOG文本
四大名著:5.66M的TXT文本,包含全篇《水浒传》、《三国演义》、《西游记》和《红楼梦》原著的标题和正文,不含简介和目录。
文字Word文档:6.38M,3569页300万字,包括四大名著(中文)、网站后台数据(中+英)、系统运行日志(英文)。
图片Word文档:113M,内有100多张占据整页图片,有页眉页脚、插入表格,另有1.8万字。
Excel:31.8M,65533 x 26网站数据导出报表。
PDF:307M,741页,均为纸质扫描的整页图片。
PPT:32.8M,24页,典型会议模板,为教程PPT,流程图和图片较多,动作不超过10个。
PNG图片:14.5M,3024 x 4032,位深32。
JPG图片:16.8M,3000 x 4000,位深24,水平、垂直分辨率均为72dpi。
FLAC音频:78.2M,时长6分22秒,比特率700多kbps。
MP3音频:6M,时长6分22秒,比特率128kbps。
MP4视频:105M,1920 x 1080,时长20秒,视频总比特率44000kbps,帧率60,音频比特率136kbps,双声道,采样频率48kHz。
安装包:199M,9.7.15.29157版本的QQ。
下面为压缩测试文件夹图片,以大小降序排列:

[attach]103017[/attach]

5 总文件夹

[attach]103018[/attach]

6 小文件

[attach]103019[/attach]


图7 大文本

[attach]103021[/attach]


8 四大名著

[attach]103020[/attach]


9 文字Word文档

[attach]103022[/attach]


10 图片Word文档

[attach]103023[/attach]


11 Excel

[attach]103024[/attach]


图12 PDF

[attach]103025[/attach]


13 PPT

[attach]103026[/attach]


14 PNG图片

[attach]103027[/attach]


15 JPG图片

[attach]103028[/attach]


16 FLAC音频

[attach]103029[/attach]


17 MP3音频

[attach]103030[/attach]


18 MP4视频

[attach]103031[/attach]


15 安装包

最后,当然要让大家看一下本次测试中恐怖的Excel表格。

[attach]103032[/attach]

16 密恐快乐表

本人为火绒论坛新人,这篇文章是我最近这两天对文件压缩的研究,若有不足之处,还请指正。

作者: pvzpvz    时间: 2023-9-5 18:26
winrar用习惯了
作者: 小龙哥    时间: 2023-9-6 11:56
本帖最后由 小龙哥 于 2023-9-13 10:07 编辑

一、测试文件详情补充
大文本:达梦数据库256M的LOG文本,文件过大不能用记事本打开,用LTF Viewer打开后既有乱码又有正常文本,换行频繁,总行数接近3000万行。
四大名著:用记事本5秒打开,用LTF Viewer瞬开。
FLAC音频:78.2M,时长6分22秒,比特率780kbps,《歌手》华晨宇 - 斗牛(Live)无损
MP3音频:6M,时长6分32秒,比特率128kbps,《歌手》张杰 - 默(Live)标准
MP4视频:在“极限竞速:地平线5”中轩尼诗F5跑高速公路,短时间内画面变化大,Win10自带录屏。
文字Word文档和图片Word文档的排序错了,改正一下。
[attach]103047[/attach]

[attach]103050[/attach]

二、重复文件压缩

1.有160万个“1”的文本文档,1.53M。
[attach]103315[/attach]

2.有1350 x 16384,共2212万个“1”的Excel表格,60.2M。
[attach]103314[/attach]

3.有1024个文本文档的文件夹,1.53G。
[attach]103316[/attach]

结果:
[attach]103317[/attach]

有大量重复内容的,压缩率会非常恐怖,可以把1.5G的文件夹压到400多K,这也是第一次测试中大文本比四大名著压缩率低的原因。

作者: 化悲痛为力量    时间: 2023-9-6 17:13
还是7z更好一些
作者: 南国东东    时间: 2023-9-6 18:51
信访系统??你胆子好大!!
作者: pvzpvz    时间: 2023-9-6 20:41
一直不理姐什么事字典
作者: 小龙哥    时间: 2023-9-7 12:05
pvzpvz 发表于 2023-9-6 20:41
一直不理姐什么事字典

我在做密码爆破的时候字典就是简易密码,txt格式,打开之后大概是这样:
123456
abcdef
Aaabbb
password
……
就是每个简易密码换一次行,这就是密码字典,当然还有拿生日做密码的:
19500101
19500102
……
20240101
一般生日密码爆破只需要两三秒。
压缩软件用的字典定义好像不一样,我只能根据我知道的大概讲一下字典是什么意思。




欢迎光临 火绒安全软件 (https://bbs.huorong.cn/) Powered by Discuz! X3.4