upload
The Unicode Consortium
Industry: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
Žr užkoduotą simbolių.
Industry:Computer; Software
(1) Reikšmių diapazoną, skaitmeninio galima kodavimo simbolių. (2) Dėl Unicode standartą, sveikųjų skaičių nuo 0 iki 10FFFF16 diapazoną.
Industry:Computer; Software
Procesas, užsakymo tekstinę informaciją vienetų. Sulyginimas yra paprastai būdinga tam tikra kalba. Taip pat žinomas kaip alphabetizing arba abėcėlės rūšiavimas. Unicode techninio standarto # 10, "Unicode sulyginimas algoritmą," apibrėžia, yra visiškai, nedviprasmiški, nurodytų užsakymo visus simbolius į Unicode standartą.
Industry:Computer; Software
Simbolis su bendrosios kategorijos, jungiant ženklas (M). *Derinant simbolių sudaryti visų simbolių tarpai derinant ženklas (Mc), Nonspacing ženklas (Mn) ir tiesiąją ženklas (Me) bendrosios kategorijos vertes. *Visus simbolius su ne nulis kanonicznych derinant klasės yra derinant simbolių, tačiau antroje pusėje nėra atveju: yra derinant simbolių su nulio kanonicznych derinant klasės. *Privataus naudoti simbolių (Co) kaip derinant simbolius ar ne aiškinimas yra nustatomas pagal įgyvendinimo. *Šiuos simbolius paprastai nenaudojami atskirai išskyrus atvejus, kai jie yra apibūdinti. Jie apima tokius simbolius kaip akcentais, diakritinius simbolius, hebrajų taškų, arabų samogłoskę požymių ir indų matras . *Grafinio objekto padėties nustatymas pobūdžio derinant priklauso paskutinį ankstesnis bazinis simbolis, išskyrus atvejus, kai jie atskiriami simboliu, kuris yra nei derinant simbolių, nei nulinio pločio jungimas arba nulinio pločio nonjoiner. Derinant simbolių sako, kad taikomos tos bazės simbolių. *Ten gali būti Nr tokios bazės simbolis, pvz., kai besijungiančių simbolis yra teksto pradžioje arba taip kontrolės arba formatas pobūdžio — pvz., vežimo grąžinimo, tab arba dešinės kairę ženklas. Tokiais atvejais derinant simbolių vadinami izoliuoti derinant simbolių. *, Izoliuoti derinant simbolius arba kai procesas yra negali atlikti grafinę derinys, procesas gali pateikti derinant simbolį be grafinę derinys; tai yra, ji gali pateikti jį, jeigu jis buvo pagrindinis simbolių. *Atstovas vaizdus, derinant simboliai yra vaizduojamas su taškuota apskritimo kodas diagramose. , Kai pateikiama grafinė kartu su a prieš bazės pobūdžio, kad bazę simbolis yra skirtas rodomi punktyras apskritimo užimamas pareigas.
Industry:Computer; Software
Didžiausias simbolių seka, sudaryta arba bazės simbolių, po vieną ar daugiau simbolių seką, tais atvejais, kai kiekvienas yra pobūdžio derinant nulio pločio jungimas arba nulinės pločio nejungimas; arba vieną ar daugiau simbolių, kai kiekvienas yra derinant simbolį, nulinio pločio jungimas arba nulinio pločio nejungimas seką.Kai nustatant a derinant *simbolių seka į Unicode tekstą, derinant apibrėžimas simbolių seka taikoma aukštesnėje. Pvz., sekos < c, dot žemiau, caron, ūmaus, a >, visą seką, < c, dotbelow, caron, ūmus > identifikuojama kaip derinant simbolių etapas, o ne alternatyvus identifikavimo < c, dot žemiau > kaip a derinant simbolių seka po atskirą (su defektais) derinant simbolių seka < caron, ūmus >.
Industry:Computer; Software
Didžiausias simbolių seka, sudaryta arba bazės simbolių, po vieną ar daugiau simbolių seką, tais atvejais, kai kiekvienas yra pobūdžio derinant nulio pločio jungimas arba nulinės pločio nejungimas; arba vieną ar daugiau simbolių, kai kiekvienas yra derinant simbolį, nulinio pločio jungimas arba nulinio pločio nejungimas seką.Kai nustatant a derinant *simbolių seka į Unicode tekstą, derinant apibrėžimas simbolių seka taikoma aukštesnėje. Pvz., sekos < c, dot žemiau, caron, ūmaus, a >, visą seką, < c, dotbelow, caron, ūmus > identifikuojama kaip derinant simbolių etapas, o ne alternatyvus identifikavimo < c, dot žemiau > kaip a derinant simbolių seka po atskirą (su defektais) derinant simbolių seka < caron, ūmus >.
Industry:Computer; Software
Skaitinė vertė, atsižvelgiant į kiekvienam Unicode kodas punktui, oficialiai apibrėžiamas kaip turto Canonical_Combining_Class diapazono 0..254. *Kiekvieną kodavimo standarto simbolį derinant klasė nurodyta failo UnicodeData.txt į Unicode simbolių duomenų bazę. Bet kodas punktas nėra išvardytos kad numatytąsias reikšmes duomenų failą, \\p(Canonical_Combining_Class = 0) (arba \\p(ccc = 0) trumpo). *Ekstrahuojamas sąrašą, derinant klases, surūšiuota pagal skaitinę reikšmę, numatyta DerivedCombiningClass.txt į Unicode simbolių duomenų bazės failą. *Tik derinant ženklai turi derinant klasės nėra lygi nuliui. Beveik visų besijungiančių ženklai su klasės nėra lygi nuliui taip pat yra nonspacing ženklų, išskyrus keletą išimčių. Taip pat, ne visi nonspacing ženklai turi ne nulis derinant klasės. . Taigi, nors ryšys tarp ^ \\p(ccc=0) ir \\p(gc=Mn) yra arti, jis nebūtų tiksli ir implementacje neturėtų priklausyti nuo šios dvi sąvokos, identiški.
Industry:Computer; Software
En skrift där endast konsonanter anges. På sikt "abjad" härstammar från de fyra första bokstäverna i traditionell ordning på arabiska skriptet: alef, beh, jeem, dal.
Industry:Computer; Software
En informationsenhet används för organisation, kontroll eller representation av textdata. *När som representerar data, arten av dessa data är generellt symboliskt i motsats till vissa andra typer av data (till exempel, ljudmässiga eller visuella). Exempel på sådana symboliska data inkluderar bokstäver, ideogram, siffror, skiljetecken, tekniska symboler och dingbats. *Ett abstrakt tecken har ingen konkret form och bör inte förväxlas med en glyf. *Ett abstrakt tecken nödvändigtvis motsvarar inte inte vad en användare anser om som en "karaktär" och bör inte förväxlas med en grafem. *De abstrakta tecken kodas av Unicode-standarden som kallas Unicode-abstrakta tecken. *Abstrakta tecken inte direkt kodat i Unicode-standarden kan ofta representeras av användningen av kombinera teckensekvenser.
Industry:Computer; Software
En egenskap av abstrakta tecken. * Abstrakta tecken egenskaper se attribut abstrakta tecken miljöprojekt, baserat på deras oberoende existens som delar av skriva system eller andra akademiska världen system, oavsett deras kodning i Unicode-standarden. * Således egenskapen alfabetiskt, egenskapen skiljetecken, egenskapen Hex_Digit, Numeric_Value egendom och så vidare är egenskaper för abstrakta tecken och är associerade med dessa tecken om kodat i Unicode-standarden eller i någon annan teckenkodning – eller ens före deras kodade i alla teckenkodningsstandard.
Industry:Computer; Software