Сцісканне дадзеных

Зьвесткі зь Вікіпэдыі — вольнай энцыкляпэдыі.

Сцісканне дадзеных — працэдура перакадавання дадзеных, якая ажыццяўляецца з мэтай памяншэння іх аб'ёму. Ужываецца для больш рацыянальнага выкарыстання сродкаў захоўвання і перадачы дадзеных.

Сцісканне бывае без стратаў (калі магчыма аднаўленне зыходных дадзеных без скажэнняў) або са стратамі (аднаўленне магчыма з малаважнымі скажэннямі). Сцісканне без стратаў выкарыстоўваецца пры апрацоўцы кампутарных праграм і дадзеных. Сцісканне з стратамі звычайна ўжываецца для скарачэння аб'ёму гукавай, фота- і відэаінфармацыі, яно значна эфектыўней сціскання без стратаў.

Сцісканне заснавана на пазбаўленні надмернасці інфармацыі, якая змяшчаецца ў зыходных дадзеных. Прыкладам надмернасці з'яўляецца паўтор у тэксце фрагментаў (напрыклад, слоў натуральнай або машыннай мовы). Падобная надмернасць звычайна выдаляецца заменай паўтаральнай паслядоўнасці карацейшым значэннем (кодам). Іншы выгляд надмернасці звязаны з тым, што некаторыя значэнні ў сціскаемых дадзеных сустракаюцца часцей іншых, пры гэтым магчыма замяняць часта сустракаемыя дадзеныя карацейшымі кодамі, а рэдкія — даўжэйшымі (імавернаснае сцісканне). Сцісканне дадзеных, якія не валодаюць уласцівасцю надмернасці (напрыклад, выпадковы сігнал або шум), немагчыма. Таксама, звычайна немагчыма сціснуць зашыфраваную інфармацыю.

[рэдагаваць] Алгарытмы сціскання тэкстаў/файлаў невядомага фармату

Маецца 2 асноўных падыходу да сціску файлаў невядомага фармату.

  • На кожным кроку алгарытму сціскання наступны сімвал змяшчаецца як ёсць (з адмысловым сцягам, які азначае, што ён не сціснуты), альбо паказваюцца межы слова з папярэдняга кавалка, якое супадае з наступнымі сімваламі файла. Разархіваванне файлаў сціснутых такім чынам выконваецца вельмі хутка, таму гэтыя алгарытмы выкарыстоўваюцца для стварэння самараспакоўных праграм.
  • Для кожнай паслядоўнасці ў кожны момант часу збіраецца статыстыка яе сустракаемасці у файле. На яе аснове вылічаецца верагоднасць значэнняў для чарговага сімвалу. Пасля гэтага можна ўжываць арыфметычнае кадаванне або кадаванне Хафмана для замены часта сустракаемых паслядоўнасцяў на карацейшыя, а рэдка сустракаемых — на даўжэйшыя.