Համակարգիչներ, Տեղեկատվական տեխնոլոգիաների

Կոդավորում տեքստային տեղեկատվության համակարգչում

Computer - բարդ սարք, որի հետ դուք կարող եք ստեղծել, նորադարձ, եւ տեղեկատվություն պահելու: Սակայն, համակարգչային չի աշխատում, շատ հասկանալի ձեւով մեզ համար գրաֆիկական, տեքստային եւ թվային տվյալները պահվում են որպես երկուական arrays համարներ. Այս հոդվածում մենք նայում, թե ինչպես կոդավորման տեքստում տեղեկատվության.

Թե ինչ է մեզ համար այն է, որ տեքստը մի համակարգչի մի հաջորդականությունը կերպարների: Յուրաքանչյուր խորհրդանիշ ներկայացնում է որոշակի շարք zeros ու նորերը. Տակ խորհրդանիշները նշանակում է ոչ միայն մեծատառ եւ փոքրատառ տառերը Լատինական այբուբենի, այլեւ կետադրական նշանները, թվաբանություն նշանները, հատուկ գրանշանները հատուկ սիմվոլների եւ նույնիսկ տիեզերական:

Երկուական կոդավորում տեքստային տեղեկատվության

Սեղմելով որոշակի ստեղնը ներքին վերահսկիչ ուղարկում է էլեկտրական ազդանշան, որը փոխարկվում է երկուական կոդը: Կոդ, որը համապատասխանում է որոշակի խորհրդանիշ, որը ցուցադրվում է էկրանին: Ներկայացնելու համար լատինական այբուբենի թվային ձեւաչափով ASCII կոդավորմամբ միջազգային համակարգը ստեղծվել է: Այն պահանջում է 1 բայթ գրանցման մեկ խորհրդանիշ այդպիսով բաղկացած ութ-խորհրդանիշ հաջորդականության zeros ու նորերը. Ձայնագրման միջակայքը - ից 00000000 դեպի 11111111, այսինքն կոդավորում տեքստային տեղեկատվության օգտագործելով այս համակարգը թույլ է տալիս մեզ ներկայացնում 256 նիշ: Շատ դեպքերում, դա բավական է:

ASCII բաժանված է երկու մասի. Առաջին 127 նիշ (սկսած 00000000 ից 01111111) են միջազգային են եւ հատուկ խորհրդանիշներ ու տառերը անգլերեն այբուբենի. Երկրորդ մասը երկարաձգումը (- ից 10000000 է 11111111), որը նախատեսված է ներկայացնում ազգային այբուբենը, գիրը, որը տարբերվում է լատիներենից:

Կոդավորում տեքստը տեղեկատվությունը ASCII որը կառուցվել է սկզբունքով աճող հերթականության, այսինքն, այնքան ավելի մեծ է հաջորդականությունը համարը նամակներ, այնքան ավելի մեծ արժեքը իր ASCII կոդը: Թվեր եւ Ռուսաստանի մի մասը սեղանին են կառուցվել է նույն սկզբունքով:

Սակայն, որ աշխարհում կան մի քանի տեսակներ կոդավորման համար կիրիլիցայի: Առավել տարածված - ն Koi-8 (ութ-bit կոդավորման, որ արդեն օգտագործվում է 70 - ական թվականներին է առաջին ruifitsirovannyh Unix օպերացիոն համակարգի), ISO 8859-5 (մշակվել է Ստանդարտացման միջազգային բյուրոյի), CP - 1251 (կոդավորման տեքստային տվյալների օգտագործվում է ժամանակակից OS Windows), ինչպես նաեւ 2-բայտ կոդավորում Unicode, որը կարող է օգտագործվել է ներդնել 65.536 նիշ. Այդպիսի մի շարք encodings պայմանավորված է նրանով, որ դրանք մշակվել են տարբեր ժամանակներում, տարբեր օպերացիոն համակարգերի եւ տարբեր նկատառումներով. Այս պատճառով, հաճախ են դժվարությունների ժամանակ, երբ փոխանցելու տեքստը մեկ կրիչի մյուսը - ից մի անհամապատասխանություն կոդավորման օգտագործողին կարող եք տեսնել մի շարք շփոթեցնող պատկերիկների: Ինչպես կարող եմ շտկել այս իրավիճակը. Խոսքով, օրինակ, երբ մի փաստաթուղթ է բացվել, մի հաղորդագրություն, խնդիրների մասին, ինչպես տեքստի ցուցադրման եւ առաջարկում է մի շարք տարբերակներ համար transcoding:

Այսպիսով, կոդավորում եւ մշակումը տեքստային տեղեկատվության համակարգչի ընդերքի գործընթաց է դժվար եւ ժամանակատար կազմակերպվել: Բոլոր խորհրդանիշները ցանկացած այբուբենի են միայն որոշակի հաջորդականությունը թվերի երկուական համակարգի, մեկ բջջային, - այս մեկն բայթ տեղեկատվության.

Համակարգիչներ, Տեղեկատվական տեխնոլոգիաների

Կոդավորում տեքստային տեղեկատվության համակարգչում

Similar articles

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Համակարգիչներ

Trending Now

Առողջություն

Կազմում

Օրենք

Ուտելիք եւ Խմիչք

Արվեստ եւ ժամանց

Ճանապարհորդություն

Newest

Արվեստ եւ ժամանց

Ճանապարհորդություն

Գործ

Մտավոր զարգացում

Նորություններ եւ Հասարակություն

Մտավոր զարգացում