it-gundan.com

어떤 아카이브 / 압축 형식입니까?

지퍼, rar, 7z, gzip, bzip2, 타르 등 나는 7z가 그 달의 맛이고, 왜? 모든 상황에 가장 좋습니까? 특정 상황에 대한 선택이 더 나은 선택입니다.

또는 실제 파일 아카이버 IE WinZip, WinRAR, 7zip 등 (형식과 같이)은 더 큰 효과가 있습니까?

귀하의 답변에서 언급 된 형식이 사용하는 일종의 속도/압축률을 설명 할 수 있습니다.

답변을 백업하는 경험적 테스트에 대한 링크를 제공하십시오.

배경 : 많은 반복적 인 데이터를 포함하는 각각을 포함하는 약 3000 개의 상대적으로 작은 파일 (10MB가 적은)을 만드는 사용자 정의 검색 인덱스를 백업해야합니다.

(일반적인 Wikipedia는 관련 기사 성능 비교 섹션이 간단합니다.)

감사 해요

8
Ash

권장 독서 :

멀티 코어 시대의 파일 압축 (Jeff Atwood A.K.A. Codinghorror, 2009 년 2 월, 2009 년 2 월)

스택 오버플로에서 매일 매우 큰 백업 파일을 생성 할 때 파일 압축으로 조금씩 놀고있었습니다.

우리는 데이터베이스 서버에서 최신 64 비트 7zip (4.64)을 사용하고 있습니다. 나는 바탕 화면의 듀얼 코어보다 큰 팬이 아니지만 서버에 대해 브레이크가 없습니다. 더 많은 CPU가 Merrier를 코어합니다! 이 서버에는 두 개의 쿼드 코어 CPU가 있으며, 총 8 개의 코어가 있으며, 나는 RAR도 7zip도 2보다 더 많은 사용을하는 것처럼 보이지 않는 것을 발견하기 위해 조금 낙담했습니다.

아직도, 2 개의 코어를 압축 할 수있는 경우에도 7zip 알고리즘은 놀랍도록 효과적이며 지난 몇 년 동안 진화하여 최적이기도합니다. 나는 지퍼 위에 rar를 추천했지만, 7zip의 효율성이 높아지고, 그것이 자유롭고 rar가 아니라는 사실은 이제 논리적 인 선택입니다.

알고리즘과 관련하여 :

BzIP2는 왜 7zip보다 훨씬 빠르게 작동 할 수 있습니까? [...] BZIP2는 2 개 이상의 CPU 코어를 사용하여 작업을 병렬화합니다.

10
splattne

효율성과 속도에 대한 전부는 아닙니다. 그들이 중요하고 당신은 그것들을위한 벤치 마크를 볼 수 있고 옵션에서 현명하게 선택할 수 있습니다 (그러나 자신만의 서버에서 자신만의 데이터를 자신의 데이터를 간단히 벤치마킹하는 것이 좋습니다). 그러나 아카이빙은 필연적으로 데이터에 다시 액세스하는지 어느 시점에도 데이터에 액세스 하는지를 초래합니다 (그렇지 않으면 삭제 만하지 만?). 아니면 몇 년 동안 도로 아래로 데이터에 데이터에 액세스하지 않을 것입니다. 그러나 누군가 제 3 자. 사람들이 인식하는 데이터와 사람들에게 액세스해야 할 때 주변에있을 것입니다. 나는 개인적으로 7zip을 사용하지만 파일을 아카이브 할 때 다른 사람들이 zip을 사용해야 할 수도 있습니다. 그들은 그것을 알고 있으며, 많은 도구가 그것을 처리 할 수 ​​있습니다. 그것은 매우 빠르지 않거나 작지만 작을 수는 있지만 인간 인자에 도움이됩니다.

4
Joshua Hunter

lzma 압축비와 속도 모두에서 잘 수행되는 것으로 보인다.

다음에서 http://tukaani.org/lzma/benchmarks 벤치 마크가 가장 빠른 bzip2 옵션보다 압축을줌으로써 가장 빠른 bzip2 옵션보다 훨씬 빠른 압축 시간을 가장 빠른 압축 시간을주었습니다.

[____.] 비율 BZIP2 Lzmash 
 35.8 % 31.7 % 
 34.0 % 25.4 % [.____. ____.] 시간 bzip2 lzmash [____.] 가장 빠른 1M 26s 0m 58S [.____] 2m 37s 12m 20s 
 * Linux 용 OpenOffice.org 1.1.4의 전체 설치 압축 (203MB) 

그것은 바이너리 데이터로 특히 잘 수행되지만, bzip2가 능숙한 일반 텍스트의 일부 벤치 마크를 읽는 것 같습니다.

Lzma Man 페이지는 읽을 가치가 있습니다.

   lzma  provides  notably  better compression ratio than bzip2 especially
   with files having other than plain text content. The other advantage of
   lzma  is fast decompression which is many times quicker than bzip2. The
   major disadvantage is that achieving  the  highest  compression  ratios
   requires  extensive  amount of system resources, both CPU time and RAM.
   Also software to handle LZMA  compressed  files  is  not  installed  by
   default on most distributions.
3
Guy C

이것을보십시오 Wikipedia 항목 . 바닥쪽으로 "효율성 비교". 그것은 압축률과 시간을 찍은 시간을 줄 것입니다. 모든 숫자는 사용되는 기계의 속도, 메모리 양 등을 기반으로 다양합니다 (속도 현명).

더 많은 압축 벤치 마크 :

2
user1797

ZIP, 7Z, 2 가지 경우와 함께 RAR을 비교합니다

정확히 압축하고있는 것에 달려 있지만 일반 7Z는 여러 프로세서를 더 잘 사용하며 7Z 압축 형식 자체는 지퍼보다 높은 압축이 높고 때로는 RAR보다 높습니다 (RAR 및 7z는 거의 동일하지만 RAR이지만 'T 무료 ...)

몇 달 전이 결과를 주셨습니다.

단일 10MB 액세스 데이터베이스 파일 압축 :

Database.mdb 17,240,064 (original)
Database.Zip  1,634,794 (Regular Zip, 11:1)
Database.rar    262,212 (RAR compression, 66:1)
Database.7z     195,678 (7-Zip compression, 88:1)

다양한 유형의 9 천 파일 이상 (903,488KB) 이상을 포함하고 다음을 얻은 폴더를 압축하고 다음을 얻었습니다 (소스 코드와 소프트웨어가 개발중인 소프트웨어를 둘러싼 모든 도구의 조합).

Type   Time  Size (KB)  Compression
Zip    7:28   247,529   3.7:1
RAR    8:15   222,232   4.1:1
7z    10:49   181,633   5.0:1

시간 목적을 위해 이것은 Core2 Duo, 2GHz, 1GB RAM 및 싼 하드 드라이브에있었습니다.

따라서 7z는 위와 지퍼를 넘어서 테스트 한 두 가지 경우에서 압축비가 실질적으로 향상되었고 RAR에서 개선되었지만 7Z는 확실히 느려졌습니다. 그렇게 그렇지 않지만 주목할만큼 충분하지 않습니다.

-아담

2
Adam Davis

나는 방금 설치 Dar (그러나 아직 놀 수있는 기회가 없었습니다). 아카이브를 여러 부분으로 분할하고 패리티를 계산하여 하나 이상의 부품이 손상되면 패리티 파일에서 재구성 할 수 있도록 패리티를 계산하여 GZIP 또는 BZIP2 압축이 포함 된 TAR와 비슷합니다.

0
pgs