Lossless vs Lossy Compression útskýrð: Heildar leiðbeiningar
Skildu grundvallarmuninn á þjöppunargerðum, reikniritum þeirra, forritum og hvernig á að velja rétta fyrir sérstakar þarfir þínar.
Skilningur á gagnaþjöppun
Gagnaþjöppun er grundvallartækni í stafrænni tækni sem dregur úr stærð skráa með því að útrýma offramboði og endurskipulagningu upplýsinga. Eftir því sem stafræni heimurinn okkar stækkar með myndum í hárri upplausn, 4K myndböndum og flóknum forritum, verður skilvirk samþjöppun sífellt mikilvægari fyrir hagræðingu geymslu, hraðari gagnaflutning og minni bandbreiddarnotkun.
Þjöppunaralgrím falla í tvo aðalflokka: taplaus og tapsár. Að skilja muninn á þessum aðferðum er nauðsynlegt til að taka upplýstar ákvarðanir um hvernig eigi að geyma, senda og vinna með stafræn gögn í ýmsum forritum og atvinnugreinum.
Af hverju þjöppun skiptir máli
Sprenging stafræns efnis hefur gert þjöppun mikilvægari en nokkru sinni fyrr. Allt frá streymisþjónustu sem skilar 4K myndböndum í farsíma, til skýjageymslupalla sem hýsa milljarða skráa, til netvafra sem hlaða flóknum síðum á millisekúndum – þjöppunartækni er ósýnilegi krafturinn sem gerir stafræna heiminn okkar virka á skilvirkan hátt.
Lossless vs Lossy: Lykilmunur
Taplaus þjöppun
Fullkomin endurgerð upprunalegra gagna
Tapandi þjöppun
Gagnaminnkun með viðunandi gæðatapi
Varðveisla 100% af upprunalegum gögnum. Þegar það er afþjappað er niðurstaðan bita fyrir bita eins og upprunann.
Fjarlægir varanlega gögn sem þykja minna mikilvæg. The upprunalegu skrána er ekki hægt að endurheimta fullkomlega eftir þjöppun.
Nær venjulega 2:1 til 5:1 þjöppunarhlutföll eftir gagnagerð. Takmarkað af kröfunni um að varðveita allar upplýsingar.
Getur náð miklu hærri hlutföllum, oft 10:1 til 100:1 eða meira, með því að henda „skynjunarlega óþarfi“ upplýsingum.
Texti, keyranleg forrit, gagnagrunnar, læknisfræðilegar myndir, skjalageymsla, fagleg vinnuflæði, allt sem þarfnast fullkominnar enduruppbyggingar.
Myndir, tónlist, straumspilun myndbanda, vefgrafík og önnur forrit þar sem gagnatap er ásættanlegt í hagnýtum tilgangi.
Getur þjappað og þjappað niður mörgum sinnum án niðurbrots. 100. þjöppunin er eins og sú 1.
Hver endurþjöppun kynnir viðbótar gæðatap. Þetta „kynslóðatap“ safnast upp með hverri lotu.
Krefst almennt minni reiknikraftur fyrir kóðun/afkóðun samanborið við háþróaða taplausa reiknirit.
Oft þarf fleiri tölvuauðlindir, sérstaklega fyrir háþróuð reiknirit eins og myndkóða.
Taplaus þjöppun útskýrð
Hvað er tapslaus þjöppun?
Taplaus þjöppun minnkar skráarstærð með því að bera kennsl á og útrýma tölfræðilegri offramboði án þess að fjarlægja allar upplýsingar. Þegar hún er afþjöppuð er skráin bita fyrir bita eins og upprunalega, með nákvæmlega ekkert tap á gæðum eða gagnaheilleika.
Hvernig taplaus þjöppun virkar
Taplaus þjöppunaralgrím nota ýmsar aðferðir til að minnka skráarstærð en tryggja fullkomna endurgerð upprunalegu gagna. Þessar aðferðir greina mynstur, tíðni og uppbyggingu innan gagna til að umrita þau á skilvirkari hátt án þess að tapa upplýsingum.
Run-Length Encoding (RLE)
RLE kemur í stað röð af eins gagnaþáttum (keyrslur) með einu gildi og tölu. Til dæmis, „AAAAAABBBCCCCC“ verður „6A3B5C“, sem dregur verulega úr stærð gagna með mörgum endurteknum röðum.
Original: WWWWWWWWWWBBBWWWWWWWWWWWWBBBWWWWWWWWWW Compressed: 10W3B12W3B10W
Huffman erfðaskrá
Þessi tækni úthlutar kóða með breytilegri lengd til að setja inn stafi, með styttri kóða fyrir tíðari stafi. Þessi tölfræðilega nálgun fínstillir kóðun byggt á dreifingu stafatíðni.
Frequent character 'e': 101 Less frequent 'z': 1010101011
LZ77 og LZ78 reiknirit
Þessar aðferðir sem byggja á orðabókum koma í stað endurtekinna tilvika gagna með tilvísunum í eitt eintak sem þegar er til staðar í óþjappaða straumnum. Þau mynda grunninn að vinsælum sniðum eins og ZIP og GIF.
Instead of storing "compression compression" Store "compression [pointer to earlier instance]"
Deflate algorithm
Með því að sameina LZ77 og Huffman kóðun veitir Deflate framúrskarandi þjöppun með góðum hraða. Það er notað í ZIP, PNG og HTTP þjöppun (gzip), sem gerir það að einu af útbreiddustu reikniritunum.
- ZIP skjalasafn
- PNG myndir
- HTTP þjöppun (gzip)
Reiknikóðun
Þessi tækni táknar skilaboð sem talnasvið á milli 0 og 1. Hún getur náð þjöppunarhlutföllum nálægt fræðilegum óreiðumörkum, sem gerir það mjög skilvirkt fyrir ákveðnar tegundir gagna.
Getur umritað brotabita fyrir hvert tákn, sem býður upp á betri þjöppun en Huffman fyrir margar heimildir.
Delta kóðun
Í stað þess að geyma algild gildi geymir deltakóðun mismun á gildum í röð. Þetta er sérstaklega áhrifaríkt fyrir gögn þar sem aðliggjandi gildi eru svipuð, eins og hljóðsýni eða skynjaralestur.
Original: 105, 107, 106, 110, 108 Delta: 105, +2, -1, +4, -2
Algeng taplaus skráarsnið
Skjalasafn
Myndir
Hljóð
Lossy samþjöppun útskýrð
Hvað er Lossy Compression?
Tapsþjöppun dregur úr skráarstærð með því að útrýma varanlega ákveðnum upplýsingum, sérstaklega óþarfi eða skynjun minna mikilvægum gögnum. Afþjappaða skráin er frábrugðin upprunalegu, en munurinn er hannaður til að vera erfitt eða ómögulegt fyrir menn að skynja við venjulegar aðstæður.
Hvernig tapsþjöppun virkar
Tapsþjöppun nær marktækt hærra þjöppunarhlutfalli með því að taka stefnumótandi ákvarðanir um hvaða gögnum á að henda. Þessi reiknirit nýta þekkingu um skynjun mannsins – það sem augu okkar og eyru geta og geta ekki greint – til að fjarlægja upplýsingar á þann hátt sem lágmarkar merkjanleg áhrif á gæði.
Umbreyta kóðun
Þessi tækni umbreytir gögnum frá einu léni (eins og staðbundnu) yfir í annað (eins og tíðni) þar sem hægt er að beita þjöppun á skilvirkari hátt. Discrete Cosine Transform (DCT) sem notað er í JPEG er gott dæmi.
- Umbreyttu myndblokkum í tíðnihluti
- Kvantaðu hátíðnihlutana af meiri árásargirni
- Augu manna eru minna næm fyrir þessum tíðni
Magngreining
Magngreining dregur úr nákvæmni gagnagilda. Það kortleggur úrval inntaksgilda yfir í minna sett af úttaksgildum, sem dregur í raun úr fjölda bita sem þarf til að tákna gögnin.
Original values: 4.13, 4.28, 4.97, 4.02 Quantized to: 4, 4, 5, 4
Psychoacoustic Modeling
Þessi tækni er notuð í hljóðþjöppun og nýtir sér takmarkanir heyrnar manna. Það auðkennir hvaða hljóðhluti er hægt að fjarlægja án þess að hafa áhrif á skynja hljóðgæði.
- Hlustunargrímur: Háværari hljóð hylja rólegri hljóð
- Tíðninæmi: Menn heyra meðalsviðstíðni best
- Tímabundin gríma: Hljóð geta dulið önnur sem eiga sér stað stuttu fyrir/eftir
Skynjunarkóðun
Svipað og sálræn líkön, en fyrir sjónræn gögn, fjarlægir þessi aðferð upplýsingar sem ólíklegra er að augu manna taki eftir, sérstaklega í hátíðniupplýsingum og litaafbrigðum.
Notað í JPEG, MPEG og öðrum sjónrænum þjöppunarstöðlum til að forgangsraða skynjunar mikilvægum gögnum.
Hreyfingarbætur
Myndbandsþjöppunartækni sem nýtir tímabundna offramboð með því að kóða mismun á milli ramma frekar en hvern heilan ramma. Aðeins breytingar frá einum ramma til annars eru að fullu kóðaðar.
- Geymið heila „lykilramma“ (I-rammar) reglulega
- Fyrir aðra ramma, geymdu aðeins mismun (P-rammar) eða tvíátta mismun (B-rammar)
- Skilar sér í stórkostlegri lækkun skráarstærðar fyrir myndband
Chroma Subsampling
Þessi tækni dregur úr litaupplýsingum meira en birtuupplýsingar og nýtir sér meiri næmni mannsaugans fyrir birtu en litamun.
- 4:4:4 – Engin undirsýnataka (fullur litur)
- 4:2:2 – Helmingur lárétta litaupplausn
- 4:2:0 – Helmingar bæði lárétta og lóðrétta litaupplausn
Algeng tapsskráarsnið
Myndir
Hljóð
Myndband
Hagnýt forrit og notkunartilvik
Stafræn ljósmyndun
Taplaus þjöppun
- RAW snið varðveisla fyrir atvinnuljósmyndara
- Vönduð geymsla mikilvægra ljósmynda
- Myndir sem krefjast mikillar eftirvinnslu eða klippingar
- PNG snið fyrir grafík með texta eða skörpum brúnum
Tapandi þjöppun
- JPEG fyrir daglegar myndir og vefmiðlun
- Myndun smámynda fyrir myndasöfn og forsýningar
- Upphleðslur á samfélagsmiðlum þar sem stærðartakmörk gilda
- Tölvupóstviðhengi og skilaboðaforrit
Hljóðframleiðsla
Taplaus þjöppun
- Meistaraupptökur í stúdíóum (WAV, FLAC)
- Safn hljóðsækinna tónlistar
- Hljóðverkfræði og fagleg klipping
- Safn mikilvægra upptaka
Tapandi þjöppun
- Straumþjónusta (Spotify, Apple Music)
- Færanlegir tónlistarspilarar með takmarkað geymslupláss
- Netútvarp og podcast
- Bakgrunnstónlist fyrir myndbönd og kynningar
Myndbandsframleiðsla
Taplaus þjöppun
- Framleiðslumeistarar í kvikmyndum og sjónvarpi
- Upprunaefni fyrir sjónræn áhrif
- Háfjárhagsleg verslunarvinna
- Læknisfræðileg og vísindaleg myndbandsgögn
Tapandi þjöppun
- Straumspilunarkerfi (Netflix, YouTube)
- Útvarpað sjónvarp
- Myndfundir og vefnámskeið
- Myndbönd á samfélagsmiðlum
Vefþróun
Taplaus þjöppun
- PNG fyrir lógó, tákn og grafík með gagnsæi
- SVG fyrir stigstærð viðmótsþætti
- WebP taplaust fyrir flókna grafík sem krefst fullkominna gæða
- Textatengd eignaþjöppun (HTML, CSS, JavaScript)
Tapandi þjöppun
- JPEG eða WebP fyrir ljósmyndir og flóknar myndir
- MP4 myndband með viðeigandi merkjamáli
- Bakgrunnstónlist og hljóðbrellur
- Framsækin myndhleðsla fyrir hraðari skynjaða frammistöðu
Gagnageymsla og geymslu
Taplaus þjöppun
- Afrit af gagnagrunni og útflutningur
- Geymsla frumkóða
- Skjalasafn (PDF, Office skrár)
- Mikilvægar viðskiptaskrár og lagaleg skjöl
Tapandi þjöppun
- Eftirlitsmyndband með viðunandi gæðakröfum
- Ógagnrýnin fjölmiðlasöfn þar sem gæðatap er ásættanlegt
- Sjálfvirk öryggisafrit af efni sem notendur búa til
- Stórfelld gögn þar sem ekki er krafist fullkominnar tryggðar
Farsímaforrit
Taplaus þjöppun
- Keyranlegar skrár og kóða forrita
- HÍ þættir sem krefjast fullkominna gæða
- Texti og stillingargögn
- Afrit af mikilvægum notendagögnum
Tapandi þjöppun
- Myndir og grafík í forriti
- Kennslumyndbönd og sýnikennsla
- Hljóðtilkynningar og hljóðrás
- Innihald í skyndiminni til að skoða án nettengingar
Þjöppunartegundir eftir skráarsniði
Mismunandi skráarsnið nota sérstaka þjöppunartækni sem er fínstillt fyrir innihaldsgerð þeirra. Að skilja hvaða snið nota hvaða þjöppunaraðferðir hjálpar þér að taka betri ákvarðanir um að geyma og deila stafrænu efninu þínu.
| Snið | Tegund | Þjöppunaraðferð | Best notað fyrir | Þjöppunarhlutfall |
|---|---|---|---|---|
| Myndsnið | ||||
| PNG | Taplaus | Tæma (LZ77 + Huffman) | Grafík, skjámyndir, myndir með texta eða gagnsæi | 1,5:1 til 3:1 |
| JPEG | Taplaus | DCT, magngreining | Ljósmyndir, flóknar myndir með sléttum litaskiptum | 10:1 til 20:1 |
| WebP | Hybrid | Forspárkóðun (taplaus), VP8 innan ramma (taplaus) | Vefgrafík, móttækilegar myndir | Tapað: 25-35% minna en JPEG Taplaust: 26% minna en PNG |
| TIFF | Taplaus | Ýmislegt (LZW, ZIP, osfrv.) | Fagleg ljósmyndun, prentun, geymslu | 1,5:1 til 3:1 |
| AVIF | Taplaus | AV1 innanramma kóðun | Næsta kynslóð vefmynda, háþróuð forrit | Allt að 50% minni en JPEG |
| Hljóðsnið | ||||
| MP3 | Taplaus | Psychoacoustic líkan, MDCT | Tónlist, podcast, almenn hlustun | 10:1 til 12:1 |
| FLAC | Taplaus | Línuleg spá, hrísgrjónakóðun | Safn hljóðsækinna tónlistar, geymslu | 2:1 til 3:1 |
| AAC | Taplaus | Háþróuð sálræn módelgerð | Stafræn útsending, streymisþjónusta | Betri gæði en MP3 á sama bitahraða |
| Opus | Taplaus | SILK + CELT merkjamál | Raddsamskipti, rauntímaforrit | Yfirburðir en aðrir merkjamál með lágum bitahraða |
| WAV | Óþjappað | Engin (venjulega, þó nokkur þjöppun möguleg) | Stúdíóupptaka, master hljóðskrár | 1:1 (engin þjöppun sjálfgefið) |
| Myndbandssnið | ||||
| H.264/AVC | Taplaus | Hreyfingarbætur, DCT, CABAC/CAVLC | Straumspilun, útsending, stafræn myndbönd | 50:1 til 100:1 |
| H.265/HEVC | Taplaus | Háþróuð hreyfispá, stærri kóðunarkubbar | 4K/8K efni, afkastamikill streymi | 25-50% betri en H.264 |
| AV1 | Taplaus | Háþróuð spá og umbreytingarkóðun | Næsta kynslóð streymisforrita án höfundarréttar | 30% betri en HEVC |
| ProRes | Taplaus (sjónrænt taplaust) | DCT byggt innanramma | Vídeóklipping, eftirvinnsla | 5:1 til 10:1 (fer eftir afbrigði) |
| FFV1 | Taplaus | Golomb-Rice kóðar, samhengislíkön | Vídeógeymslu, varðveisla | 2:1 til 3:1 |
| Skjalasnið | ||||
| Hybrid | Tæma (texti), JPEG/JBIG2 (myndir) | Skjaladreifing, eyðublöð, útgáfur | Mjög mismunandi eftir efni | |
| DOCX/XLSX | Taplaus | ZIP (kjarni), ýmislegt fyrir innbyggða hluti | Skrifstofuskjöl, töflureikni | 1,5:1 til 3:1 |
| EPUB | Hybrid | ZIP (ílát), ýmislegt fyrir innihald | Rafbækur, stafrænar útgáfur | Fer eftir efnisgerð |
| Skjalasafnssnið | ||||
| ZIP | Taplaus | Tæma (LZ77 + Huffman) | Almenn skjalavörsla, samhæfni milli palla | 2:1 til 10:1 (fer eftir innihaldi) |
| 7Z | Taplaus | LZMA, LZMA2, PPMd osfrv. | Þjöppunarþörf með háu hlutfalli | 30-70% betri en ZIP |
| RAR | Taplaus | Sérstakt reiknirit | Hámarksþjöppun með sértækum verkfærum | 10-30% betri en ZIP |
Hvernig á að velja rétta þjöppunargerð
Er fullkomin endurgerð upprunalegu gagna nauðsynleg?
Eru geymslutakmarkanir eða bandbreiddartakmarkanir verulegar áhyggjur?
Mun efnið fara í frekari klippingu eða vinnslu?
Bestu starfsvenjur fyrir þjöppunarstefnu
- Geymdu upprunalega meistara með taplausri þjöppun eða á óþjöppuðu formi þegar mögulegt er. Þetta þjóna sem stafrænu „neikvæðunum“ þínum.
- Búðu til tapaðar útgáfur til að dreifa og deila til að koma jafnvægi á gæði og skráarstærð miðað við fyrirhugaða notkun.
- Íhugaðu þrepaskipt nálgun með mismunandi þjöppunarstigum í mismunandi tilgangi (skjalavörslu, vinnuskrár, dreifing).
- Prófaðu mismunandi þjöppunarstillingar til að finna besta jafnvægið milli skráarstærðar og gæða fyrir tiltekið efni þitt.
- Vertu upplýstur um nýja þjöppunartækni þar sem þeir geta boðið upp á umtalsverðar umbætur í skilvirkni og gæðum.
- Skráðu þjöppunarvinnuflæðið þitt til að tryggja samræmi og gera framtíðarskráastjórnun auðveldari.
Algengar spurningar
Geturðu breytt á milli taplausrar og tapslausrar þjöppunar?
Þú getur alltaf breytt úr taplausu sniði yfir í tapað snið, en hið gagnstæða er ekki raunverulega mögulegt. Þegar upplýsingum hefur verið hent í tapaðri þjöppun er ekki hægt að endurheimta þær. Að breyta úr tapað sniði yfir í taplaust mun varðveita skrána í núverandi ástandi (þar á meðal hvers kyns gæðatap), en mun ekki endurheimta upprunalegu gögnin sem voru fjarlægð við upphaflega tapaða þjöppun.
Skemmir þjöppun skrár eða gerir þær minna stöðugar?
Tapslaus þjöppun skemmir aldrei skrár – samkvæmt skilgreiningu er afþjappaða skráin eins og upprunalega. Tapsþjöppun fjarlægir gögn varanlega, en þetta er með hönnun og miðar venjulega á upplýsingar sem hafa lágmarks skynjunaráhrif. Eins og fyrir stöðugleika, rétt þjappaðar skrár eru í eðli sínu ekki minna stöðugar en óþjappaðar. Hins vegar geta sumar mjög þjappaðar skrár verið næmari fyrir spillingu, þar sem lítil villa getur haft áhrif á fleiri gögn þegar upplýsingum er þétt pakkað.
Af hverju myndi einhver velja tapaða þjöppun ef hún fjarlægir gögn?
Lossy compression býður upp á verulega betri þjöppunarhlutföll en taplausar aðferðir, oft 10-100 sinnum minni. Þetta gerir það hagnýt fyrir forrit þar sem skráarstærð, bandbreidd eða geymslutakmarkanir eru mikilvægar í huga. Lykilinnsýn er að tapsþjöppun er hönnuð til að fjarlægja upplýsingar sem menn eru ólíklegri til að taka eftir eða sem hefur lágmarks áhrif á skynjað gæði. Fyrir mörg forrit – eins og að streyma tónlist, deila myndum eða horfa á myndbönd – er skiptingin á milli lítillar minnkunar á tæknilegum gæðum og gríðarlegrar minnkunar á skráarstærð mjög gagnlegur.
Hvernig hefur þjöppun áhrif á SEO fyrir myndir á vefsíðum?
Myndþjöppun hefur veruleg áhrif á SEO í gegnum hleðsluhraða síðu, sem er lykilþáttur fyrir leitarvélar. Rétt þjappaðar myndir draga úr þyngd síðunnar og bæta hleðslutíma, sem leiðir til betri notendaupplifunarmælinga og hærri leitarstöðu. Þó að tapað þjöppun bjóði venjulega upp á betri stærðarminnkun er lykillinn að því að finna rétta jafnvægið – myndir ættu að vera nógu þjappaðar til að hlaðast hratt en viðhalda nægjanlegum gæðum til að virkja notendur og miðla upplýsingum á áhrifaríkan hátt. Nútíma snið eins og WebP bjóða upp á frábæra þjöppun með góðum gæðum og innleiðing á móttækilegum myndum tryggir bestu afhendingu milli tækja.
Er til samþjöppunaraðferð sem virkar vel fyrir allar tegundir gagna?
Engin ein þjöppunaraðferð virkar best fyrir allar gagnagerðir. Mismunandi gerðir af efni hafa mismunandi tölfræðilega eiginleika og offramboð sem hægt er að nýta. Texti þjappast öðruvísi saman en myndir, sem þjappast öðruvísi saman en hljóð eða mynd. Jafnvel innan flokks eins og myndir, þjappast ljósmynd með sléttum litabreytingum öðruvísi saman en skarpbrún grafík með takmarkaða liti. Þetta er ástæðan fyrir því að sérhæfð snið eru til fyrir mismunandi efnisgerðir og hvers vegna nútíma þjöppunarverkfæri greina oft efni til að beita skilvirkasta reikniritinu fyrir hvert tiltekið gagnamynstur.
Hvernig veit ég hvort ég nota rétt þjöppunarstig?
Til að finna rétta þjöppunarstigið þarf að hafa þrjá þætti í jafnvægi: skráarstærð, gæði og vinnslutíma. Fyrir tapaða þjöppun skaltu framkvæma sjón- eða heyrnarpróf til að ákvarða þann stað þar sem gæðaskerðing verður áberandi fyrir tiltekið efni þitt og áhorfendur. Fyrir tapslausa þjöppun, berðu saman mismunandi reiknirit til að finna bestu stærðarminnkunina fyrir gagnategundina þína. Mörg forrit bjóða upp á forstillt þjöppunarstig (t.d. lágt, miðlungs, hátt), sem gefur góða upphafspunkta. Prófaðu alltaf þjappað úttak í því umhverfi sem það er ætlað – þjöppunarstilling sem lítur vel út á þróunarvélinni þinni gæti ekki verið ákjósanleg á mismunandi tækjum eða við mismunandi útsýnisaðstæður.
Veldur þjöppun skráa margfalt auknu gæðatapi?
Fyrir tapslausa þjöppun hafa endurteknar þjöppunar- og afþjöppunarlotur engin áhrif á gæði – skráin helst eins og upprunalega. Fyrir tapaða þjöppun kynnir hver ný þjöppunarlota venjulega viðbótargæðatap, þekkt sem „kynslóðatap“. Þetta er sérstaklega erfitt þegar mismunandi reiknirit eða stillingar eru notaðar milli kynslóða. Til dæmis, endurtekin breyting og vistun JPEG mynd mun smám saman draga úr gæðum hennar. Til að lágmarka kynslóðatap skaltu alltaf vinna úr hágæða upprunaskrá sem til er og vista millivinnu á taplausu sniði meðan á klippingu stendur.
Taktu upplýstar ákvarðanir um þjöppun
Að skilja muninn á taplausri og tapslausri þjöppun hjálpar þér að fínstilla stafræna vinnuflæðið þitt, spara geymslupláss og tryggja að efnið þitt haldi viðeigandi gæðum fyrir fyrirhugaða notkun.
