ՀամակարգիչներՏեղեկատվական տեխնոլոգիաների

Կոդավորում «Unicode»: բնավորությունը կոդավորում ստանդարտ

Ամեն Internet օգտվողին `փորձելով ստեղծել մեկը կամ մյուսը իր գործառույթը առնվազն մեկ անգամ տեսել է էկրանին գրված է լատիներեն տառերով խոսքը« Unicode »: Ինչ է դա, դուք կսովորեք կարդալով այս հոդվածը:

սահմանումը

Կոդավորում «Unicode», - Նիշերի կոդավորում ստանդարտ. Այն առաջարկվել էր Unicode Inc. ոչ առեւտրային կազմակերպության 1991 թ-ին: Ստանդարտը նախատեսված է համախմբել ամենամեծ հնարավոր թվով տարբեր տեսակի կերպարների մի փաստաթղթում: Էջ, որը հիմնադրվել է դրա հիման, կարող է պարունակել տառեր եւ սիմվոլներ տարբեր լեզուներով (Ռուսերեն Կորեացի) եւ մաթեմատիկական նշանների. Այս դեպքում, բոլոր կերպարների մեջ բնույթի սահմանում են արտածվել առանց որեւէ խնդիրների:

Պատճառները, ստեղծման

Ժամանակին վրա մի ժամանակ, դեռ մինչեւ տեսքը միասնական համակարգի «Unicode» կոդավորում է ընտրվում հիման վրա նախասիրությունների հեղինակ է փաստաթղթում: Այդ իսկ պատճառով, հաճախ է կարդալ մի փաստաթուղթ, անհրաժեշտ էր օգտագործել տարբեր սեղաններ: Երբեմն դա անհրաժեշտ է անել մի քանի անգամ, ինչը մեծապես բարդացնում է կյանքը միջին օգտագործողը: Ինչպես արդեն նշվել է, որ լուծում է այս խնդիրը 1991-ին հրավիրվել է Unicode Inc. շահույթ չհետապնդող կազմակերպություն է առաջարկել մի նոր տեսակի Նիշերի կոդավորում. Այն նախագծված է համատեղել հնացած եւ մի շարք չափանիշներ: «Unicode» - ի կոդավորման որ ozvolila հասնելու անհավատալի պահին `ստեղծել մի գործիք, որը աջակցում է մի մեծ շարք կերպարներ: Արդյունքը գերազանցեց շատ սպասելիքներ կային փաստաթղթեր միաժամանակ պարունակող, այնպես էլ անգլերեն եւ ռուսերեն տեքստը, լատիներէն եւ մաթեմատիկական արտահայտություններ:

Բայց ստեղծումը միասնական կոդավորման նախորդել անհրաժեշտության լուծել մի շարք խնդիրներ, որոնք ծագել պայմանավորված է հսկայական շարք չափանիշների արդեն գոյություն ունեցող այդ ժամանակ: Ամենատարածված նրանց:

  • Պստլիկ գրելու, կամ «անկապ խոսք».
  • սահմանափակումները, որ սիմվոլների կոդավորմամբ.
  • Խնդիրն վերծանել կոդավորումներ,
  • տառատեսակ վերարտադրությունը:

Փոքր պատմական էքսկուրս

Պատկերացրեք, որ բակում 80: Համակարգչային ապարատային չէ այնքան տարածված է եւ ունի տարբեր այսօրվանից: Թեեւ յուրաքանչյուր OS եզակի է եւ զտված յուրաքանչյուր էնտուզիաստ կոնկրետ կարիքները: Հաղորդագրություն փակցնելուց համար պետք է տեղեկատվության փոխանակման վերածվում է լրացուցիչ rework ամեն ինչից: Փորձում է կարդալ մի փաստաթուղթ ստեղծած մեկ այլ օպերացիոն համակարգով, հաճախ ցուցադրում է տարօրինակ շարք կերպարների, եւ խաղը սկսվում է կոդավորում: Դա միշտ չէ, դա անել արագ, եւ երբեմն անհրաժեշտ փաստաթուղթը Անհնար է բացել վեց ամսվա ընթացքում, եւ նույնիսկ ավելի ուշ: Մարդիկ, ովքեր հաճախ տեղեկատվության փոխանակում, ստեղծել իրենց համար փոխակերպման աղյուսակը: Եւ ապա աշխատել է նրանց բացահայտում հետաքրքիր մանրամասն, որ պետք է ստեղծել նրանց երկու ուղղություններով, «իմ ի քո" ետ եւ այլն: Դարձնել անհամ շրջում հաշվիչ մեքենա չի կարող, դրա համար ճիշտ սյունակում աղբյուրի, իսկ ձախ `արդյունք, այլ ոչ թե հակառակը. Եթե տեսնում եք, որ պետք է օգտագործել որեւէ հատուկ նիշ է փաստաթղթում, նրանք պետք է ավելացվի, իսկ հետո մեկ այլ, եւ բացատրել, որ գործընկեր, թե ինչ նա պետք է անել, որպեսզի այդ կերպարների չեն դառնում »անկապ խոսք." Եւ եկեք չմոռանանք, որ յուրաքանչյուր կոդավորում էր մշակել կամ իրականացնել իրենց սեփական տառատեսակներ, որոնք հանգեցրեցին ստեղծման մի հսկայական շարք կրկնօրինակների է OS.

Պատկերացրեք, այնուհետեւ, որ տառատեսակները էջում, Դուք կարող եք տեսնել, թե 10 կտոր նույնական Times New Roman մի փոքր Նշում: UTF-8, UTF-16, ANSI, UCS-2. Այժմ դուք հասկանում եք, որ այդ զարգացումը համընդհանուր ստանդարտների էր հրամայական.

«հիմնադիր հայրերը ստեղծողները"

Ակունքներում ստեղծման Unicode կարելի է 1987 թ., Երբ Dzho Bekker է Xerox, հետ միասին Լի Collins եւ Մարկ Դեւիսի ից Apple սկսեց ուսումնասիրություններ ոլորտում գործնական ստեղծման մի ունիվերսալ սիմվոլների կոդավորմամբ: 1988 թ. Օգոստոսին, Dzho Bekker հրապարակել է նախագիծը ստեղծման համար 16-bit բազմալեզու միջազգային կոդավորման համակարգը:

Մի քանի ամիս անց Unicode աշխատանքային խումբը մեջ ընդգրկվել է Ken Whistler եւ Մայք Kernegana է RLG, Glenn Rayt Հյուրատետր Sun Microsystems եւ մի քանի այլ մասնագետներ, հնարավորություն տալով ավարտը աշխատանք է նախնական ձեւավորումը տարածված կոդավորման ստանդարտ.

ընդհանուր նկարագրությունը

Յունիկոդի հիման վրա հասկացությունը խորհրդանիշն: Սույն սահմանումը վերաբերում է վերացական երեւույթի, որ գոյություն ունի որոշակի ձեւով գրավոր եւ իրականացված մի grapheme (նրանց «դիմանկարների»): Յուրաքանչյուր սիմվոլը տրվում է «Unicode» ծածկագրով պատկանող որոշակի միավորի ստանդարտի: Օրինակ, grapheme B է նաեւ անգլերեն եւ ռուսերեն այբուբենների, բայց դա համապատասխանում է Unicode 2 տարբեր կերպարներ. Դրանք ենթակա են դարձի փոքրատառ, ք. E., յուրաքանչյուրը, որը նկարագրում է առանցքային բազան, մի շարք հատկությունների եւ լրիվ անունը.

Առավելությունները Unicode

Այլ ժամանակակիցների կոդավորում "UNICODE" Կա մի հսկայական ֆոնդային նշանների համար «գաղտնագրման» կերպարներ: Այն փաստը, որ իր նախորդները ուներ 8 bits, որ աջակցում է 28 կերպարների, սակայն նոր դիզայնը էր արդեն 216 նիշ, որ եղել է հսկա քայլ առաջ: Դա թույլ տվեց ծածկագրել գրեթե բոլոր առկա եւ ընդհանուր այբուբեններից.

Հետ գալուստը «Unicode» այլեւս պետք է օգտագործել դարձի սեղան `որպես միասնական ստանդարտ, այն պարզապես negated անհրաժեշտությունը նրանց համար: Նմանապես, նրանք ջրասույզ մեջ մոռացության, եւ «անկապ խոսք», - մի ստանդարտ կազմել նրանց անհնար է, ինչպես նաեւ բացառել ստեղծելու անհրաժեշտության կրկնօրինակ տառատեսակներ:

զարգացումը Unicode

Իհարկե, առաջընթաց չէ տեղում, եւ քանի որ առաջին շնորհանդեսը անցել է 25 տարի. Սակայն, կոդավորում "Յունիկոդ" համառորեն պահում է իր դիրքերը աշխարհում: Շատ առումներով սա հնարավոր է դարձել շնորհիվ այն փաստը, որ այն դարձել է շատ հեշտ է իրականացնել եւ տարածելու, ճանաչվելով ծրագրավորողներին գույքային (վճարված) եւ բաց կոդով ծրագրային ապահովման.

Մենք չպետք է հավատալ, որ այսօր մենք տեսնում ենք նույն կոդը «Unicode», քանի որ քառորդ դար առաջ: Ներկայումս, այն փոխարինվում է տարբերակը 5.h.h, եւ մի շարք կոդավորված խորհրդանիշների աճել է 231-ին հնարավորության օգտագործելով ավելի մեծ մարժա նշանները հրաժարվել է դեռ պահպանել աջակցությունը Unicode-16 (կոդավորում, որտեղ առավելագույն գումարը իրենց սահմանափակ թվով 216): Քանի որ իր գործարկումից եւ մինչեւ տարբերակը 2.0.0 «Unicode ստանդարտ" ավելացրել է շարք կերպարներ, որ այն ներառված է գրեթե 2 անգամ: հնարավորություններ եւ շարունակական աճը առաջիկա տարիներին: Համար տարբերակը 4.0.0 արդեն կա անհրաժեշտություն է բարձրացնել ստանդարտ ինքնին, եւ դա արվում էր: Արդյունքում, «Unicode» -ը գտել է ձեւը, որը մենք գիտենք, որ այսօր.

Ուրիշ ինչ է Unicode.

Բացի մեծ, մշտապես թարմացվում թվի նիշերի, «Unicode» -Encoding տեքստը տեղեկատվությունը եւս մեկ օգտակար հատկություն է. Սա, այսպես կոչված հարաբերությունների կարգավորման. Ավելի շուտ, քան ոլորել միջոցով ամբողջ փաստաթղթի կերպարը ըստ բնույթի, եւ փոխարինել պատկերակները է հեռակա սեղանի, օգտագործել մեկը առկա հարաբերությունների կարգավորման ալգորիթմներ. Ինչ է դա:

Վատնելու փոխարեն ռեսուրսները համակարգչի կանոնավոր ստուգման նույն բնույթի, որը կարող է լինել նման են տարբեր այբուբեններ, օգտագործելով հատուկ ալգորիթմ: Այն թույլ է տալիս Ձեզ կատարել նմանատիպ խորհրդանշաններ առանձին սյունակ Փնտրել սեղանի շուրջ եւ կիրառել արդեն նրանց, չի ավարտվել, եւ կրկին վերստուգելու բոլոր տվյալները:

Նման ալգորիթմները կարող են մշակվել եւ իրականացվում չորս. Յուրաքանչյուր դարձից խստիվ որոշակի սկզբունքով, այլ մյուս, այնպես որ պետք է զանգահարել որեւէ մեկը նրանցից չէ, առավել արդյունավետ հնարավոր է. Յուրաքանչյուրը նախատեսված է կոնկրետ կարիքների, ներդրված եւ օգտագործվում հաջողությամբ.

տարածում ստանդարտ

Ի 25 տարվա իր պատմության կոդավորման «UNICODE« Ես ստացել թերեւս առավել տարածված է աշխարհում. Սույն ստանդարտի ճշգրտվում են, քանի որ ծրագրերի եւ վեբ-էջերի. Լայնութիւն դիմումը կարող է վկայել, որ Unicode այժմ օգտագործվում է ավելի քան 60 տոկոս ինտերնետ ռեսուրսների.

Այժմ, դուք գիտեք, երբ «Unicode» ստանդարտը հայտնվել: Ինչ է այն, որ դուք նաեւ գիտենք եւ պետք է կարողանանք գնահատել, ամբողջական նշանակությունը գյուտի, պատրաստված է մի խումբ փորձագետների Unicode Inc. Ավելի քան 25 տարի առաջ:

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hy.birmiss.com. Theme powered by WordPress.