ՀամակարգիչներՏեղեկատվական տեխնոլոգիաների

Կոդավորում տեքստային տեղեկատվության համակարգչում

Computer - բարդ սարք, որի հետ դուք կարող եք ստեղծել, նորադարձ, եւ տեղեկատվություն պահելու: Սակայն, համակարգչային չի աշխատում, շատ հասկանալի ձեւով մեզ համար գրաֆիկական, տեքստային եւ թվային տվյալները պահվում են որպես երկուական arrays համարներ. Այս հոդվածում մենք նայում, թե ինչպես կոդավորման տեքստում տեղեկատվության.

Թե ինչ է մեզ համար այն է, որ տեքստը մի համակարգչի մի հաջորդականությունը կերպարների: Յուրաքանչյուր խորհրդանիշ ներկայացնում է որոշակի շարք zeros ու նորերը. Տակ խորհրդանիշները նշանակում է ոչ միայն մեծատառ եւ փոքրատառ տառերը Լատինական այբուբենի, այլեւ կետադրական նշանները, թվաբանություն նշանները, հատուկ գրանշանները հատուկ սիմվոլների եւ նույնիսկ տիեզերական:

Երկուական կոդավորում տեքստային տեղեկատվության

Սեղմելով որոշակի ստեղնը ներքին վերահսկիչ ուղարկում է էլեկտրական ազդանշան, որը փոխարկվում է երկուական կոդը: Կոդ, որը համապատասխանում է որոշակի խորհրդանիշ, որը ցուցադրվում է էկրանին: Ներկայացնելու համար լատինական այբուբենի թվային ձեւաչափով ASCII կոդավորմամբ միջազգային համակարգը ստեղծվել է: Այն պահանջում է 1 բայթ գրանցման մեկ խորհրդանիշ այդպիսով բաղկացած ութ-խորհրդանիշ հաջորդականության zeros ու նորերը. Ձայնագրման միջակայքը - ից 00000000 դեպի 11111111, այսինքն կոդավորում տեքստային տեղեկատվության օգտագործելով այս համակարգը թույլ է տալիս մեզ ներկայացնում 256 նիշ: Շատ դեպքերում, դա բավական է:

ASCII բաժանված է երկու մասի. Առաջին 127 նիշ (սկսած 00000000 ից 01111111) են միջազգային են եւ հատուկ խորհրդանիշներ ու տառերը անգլերեն այբուբենի. Երկրորդ մասը երկարաձգումը (- ից 10000000 է 11111111), որը նախատեսված է ներկայացնում ազգային այբուբենը, գիրը, որը տարբերվում է լատիներենից:

Կոդավորում տեքստը տեղեկատվությունը ASCII որը կառուցվել է սկզբունքով աճող հերթականության, այսինքն, այնքան ավելի մեծ է հաջորդականությունը համարը նամակներ, այնքան ավելի մեծ արժեքը իր ASCII կոդը: Թվեր եւ Ռուսաստանի մի մասը սեղանին են կառուցվել է նույն սկզբունքով:

Սակայն, որ աշխարհում կան մի քանի տեսակներ կոդավորման համար կիրիլիցայի: Առավել տարածված - ն Koi-8 (ութ-bit կոդավորման, որ արդեն օգտագործվում է 70 - ական թվականներին է առաջին ruifitsirovannyh Unix օպերացիոն համակարգի), ISO 8859-5 (մշակվել է Ստանդարտացման միջազգային բյուրոյի), CP - 1251 (կոդավորման տեքստային տվյալների օգտագործվում է ժամանակակից OS Windows), ինչպես նաեւ 2-բայտ կոդավորում Unicode, որը կարող է օգտագործվել է ներդնել 65.536 նիշ. Այդպիսի մի շարք encodings պայմանավորված է նրանով, որ դրանք մշակվել են տարբեր ժամանակներում, տարբեր օպերացիոն համակարգերի եւ տարբեր նկատառումներով. Այս պատճառով, հաճախ են դժվարությունների ժամանակ, երբ փոխանցելու տեքստը մեկ կրիչի մյուսը - ից մի անհամապատասխանություն կոդավորման օգտագործողին կարող եք տեսնել մի շարք շփոթեցնող պատկերիկների: Ինչպես կարող եմ շտկել այս իրավիճակը. Խոսքով, օրինակ, երբ մի փաստաթուղթ է բացվել, մի հաղորդագրություն, խնդիրների մասին, ինչպես տեքստի ցուցադրման եւ առաջարկում է մի շարք տարբերակներ համար transcoding:

Այսպիսով, կոդավորում եւ մշակումը տեքստային տեղեկատվության համակարգչի ընդերքի գործընթաց է դժվար եւ ժամանակատար կազմակերպվել: Բոլոր խորհրդանիշները ցանկացած այբուբենի են միայն որոշակի հաջորդականությունը թվերի երկուական համակարգի, մեկ բջջային, - այս մեկն բայթ տեղեկատվության.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hy.birmiss.com. Theme powered by WordPress.