upload
The Unicode Consortium
Industry: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
ஒவ்வொன்றும் இரண்டாவது கேரக்டர் (, ஒரு Canonical Decomposition அல்லது இணக்கமுடைய Decomposition) coded கேரக்டர் வரிசை முறை மற்றும் தொடர்வதற்கு sequentially இறுதி கேரக்டர் நிகழ்த்த பின்வரும் நடவடிக்கைகள் மேற்கொள்ளப்படும்: R1 கோர பின்னால் (இடப்பக்கம்) உள்ள coded கேரக்டர் வரிசை முறை, கடந்த துவக்க l கேரக்டர் வரிசை முறை சி அருகாமையில் முந்தைய கண்டுபிடிக்க சி கேரக்டர். R2 இருந்தால் இத்தகைய ஒரு L, மற்றும் இ இல்லை தடுக்கப்படும் இருந்து L, மற்றும் ஒரு ஆரம்ப என்றழைக்கப்பட்ட p எந்த வரிசையை &lt; L, சி &gt;, canonically அதற்கு என்பது பின் l உள்ள, வரிசை முறை மூலம் p மாற்றிடு மற்றும் சி, வரிசை முறை நீக்கவும் உள்ளது. *போது, அல்கோரிதம் செய்கிறது, அனைத்து அல்லாத-தடுக்கப்பட்ட ஜோடிகள் canonically ஒரு ஆரம்ப என்றழைக்கப்பட்ட செய்ய equivalent இருக்கும் என கொருமுறை கொண்டு அந்த ஆரம்ப Composites. *அடுத்த ஆண்டிற்கான கேரக்டர்கள் வரை அந்த இடத்தில் கேரக்டர் இனி எந்த அல்லாத தடுக்கப்பட்ட ஜோடி மூலம் ஒரு ஆரம்ப என்றழைக்கப்பட்ட மாற்றப்பட்டது முடியும் என்று பகுதியாக சரிபார்க்க தொடர்ந்து R2 துவக்க l செயலாளருக்கு தேவைப்படுகிறது. உதாரணமாக, பின்வரும் கற்பனையான coded கேரக்டர் வரிசை முறை பரிசீலனை: <u>. முதல் மூன்று combining குறிகளை யாரும் forms ஒரு ஆரம்ப என்றழைக்கப்பட்ட கடிதத்தை z. கொண்டு இருந்தாலும், நான்காவது combining குறியிடு உள்ள வரிசை இந்த முறை, தீவிர, does படிவம் ஒரு ஆரம்ப என்றழைக்கப்பட்ட கொண்டு z, மற்றும் அது இல்லை தடுக்கப்படும் இருந்து Therefore z., R2 mandates, வரிசை முறை செயலாளருக்கு &lt; 007A U + z... U + தீவிர 0301 &gt; கொண்டு &lt; U + 017A z-தீவிர,... &gt;, போதிலும் மூன்று மற்ற combining குறிகள், வரிசை முறை சிறுபான்மை உள்ளன. *சி கேரக்டர் R1 உள்ள அல்ல வியூகத்தில் ஒரு துவக்க. வேண்டியது அவசியம் சரிபார்க்க, வரிசை முறை எல்லா கேரக்டர்களையும் ஏனென்றால் விமானத் தொடர் நிகழ்வுகளை &lt; L, சி &gt; எங்கு l மற்றும் சி ஆகியவை Starters பொழுதும், ஒரு ஆரம்ப என்றழைக்கப்பட்ட p அந்த வரிசையை canonically அதற்கு தற்போது உள்ளது. உதாரணமாக, Indic இரண்டு பகுதி காணப்பெறும் அடிக்கடி canonical decompositions க்குள் விமானத் தொடர் நிகழ்வுகளை இரண்டு இடைவெளி வரிசையிலும் குறிகள், Canonical_Combining_Class எந்த ஒவ்வொரு செய்துள்ளது, வேண்டும் &#61; 0 மற்றும் எந்த என்பது இவ்வாறு மூலம் விளக்கத்தை துவக்க. Nevertheless, வரிசை முறை decomposed பெற்றுள்ளது ஒரு அதற்கு ஆரம்ப என்றழைக்கப்பட்ட.
Industry:Computer; Software
உள்ள கேரக்டர் செய்ய canonical decomposition ஒரே மாதிரியாக இல்லை. அது இருக்கலாம் எனவும் அழைக்கப்பட்ட canonical precomposed எழுத்து அல்லது canonical என்றழைக்கப்பட்ட கேரக்டர்.உதாரணமாக, U + 00E0 *லத்தீன் சிறிய எழுத்து ஒரு கொண்டு பேசுகிறது என்பது canonical decomposable கேரக்டர் ஏனென்றால் அதன் canonical decomposition <u>வரிசையை. இது canonical decomposable கேரக்டர் ஏனென்றால் அதன் canonical decomposition U + 004B லத்தீன் தலைநகர் கடிதத்தில் K. U + 212A Kelvin குறி
Industry:Computer; Software
தண்டனை அதற்கு வரிசை முறை வரையிணைக்கும்-உதாரணத்திற்கு, ä ஏ வரையிணைக்கும் + umlaut ஒன்று சேர்ப்பதை. கேரக்டர் அல்லது கேரக்டர்கள் இல்லாமல் முடியும் இருக்கும் மேலும் decomposed வரையில் யூனிகோட் கேரக்டர் தரவுதள காணப்படுகிறது மற்றும் nonspacing குறிகளை reordering canonical வரைபடங்கள் பயன்படுத்துவதற்கு recursively இருந்து results என கேரக்டர் வரிசைமுறையை decomposition . *a canonical decomposition வடிவமைத்தல் தகவல்களை நீக்கு.
Industry:Computer; Software
இரண்டு கேரக்டர் விமானத் தொடர் நிகழ்வுகளை canonical equivalents இருந்தால் canonical முழு decompositions ஒரே மாதிரியாக இருக்க வேண்டும் கூறினார். *உதாரணமாக, விமானத் தொடர் நிகழ்வுகளை &lt; ஓ, combining diaeresis &gt; மற்றும் &lt;ö&gt; ஆகியவை canonical equivalents. யூனிகோட் சொத்து canonical equivalence உள்ளது. குழப்ப அது வேண்டும் இல்லை இருக்க நிலையை மொழி குறிப்பு collation அல்லது தகவலேற்றப்படும், எந்த மற்ற equivalencies சேர். உதாரணமாக, உள்ள ஸ்வீடிஷ், ö முற்றிலும் மாறுபட்ட எழுத்து o இருந்து கருதப்படுகிறது பிறகு z. உள்ள ஜெர்மன் collated உள்ளது, மற்றும் ö weakly equivalent oe என்பது மற்றும் oe கொண்டு collated உள்ளது. உள்ள ஆங்கிலம், ö வெறும் ஒரு ஓ கொண்டு குறிக்கிறது என்று அது என்பது அறிவிக்கப்பட்ட தனியாக இருந்து முந்தைய எழுத்து (கொடூர coöperate) என்பது collated கொண்டு ஓ *மூலம் விளக்கத்தை, மற்றும் அனைத்து canonical equivalent விமானத் தொடர் நிகழ்வுகளை இணக்கமுடைய equivalent விமானத் தொடர் நிகழ்வுகளை ஆகியவையும் ஒலிவேறுபாட்டு உள்ளது.
Industry:Computer; Software
Decomposed கேரக்டர் வரிசையை நோக்கியிருக்கும் D, உள்ள பரிமாற்றம் உள்ள ஒவ்வொரு Reorderable ஜோடி கேரக்டர்கள் பணியாளர்களுடன் வரையில், வரிசை முறை ஏதும் மேலும் Reorderable ஜோடிகள் கொண்டுள்ளது. *செயலில், Canonical வரிசைப்படுத்தல் அல்கோரிதம் உள்ளது என Canonical Decomposition அல்லது இணக்கமுடைய Decomposition இருக்கும் பெற்றிருக்க எந்த combining குறி தொடர்ந்து நேரடியாக மூலம் வேறு எந்த subsequences guarantees உள்ளூர் பபுள் வரிசைப்படுத்து ஒன்று சேர்ப்பதை குறைந்த, பூஜ்யம் அல்லாத combining class. என குறியிடு*Canonical வரிசைப்படுத்தல் அறுதியிடப்படும் முழு decomposed வரிசையை Canonical வரிசைப்படுத்தல் அல்கோரிதம் பயன்பாடு வருகிறது. உதாரணமாக, canonical decomposition, <u>வரிசை முறை , வரிசை முறை அதன் விளைவாக &lt; U + 0064 லத்தீன் சிறிய எழுத்து d, U + 0307 combining புள்ளி மேலே, U + 0323 combining புள்ளி கீழேயுள்ள &gt;, தற்போது இல்லை பொழுதும் canonical வரிசையில் வரிசைமுறையை. யூனிகோடு சரங்களை பெரும்பாலான decompositions ஏற்கனவே canonical வரிசையில் உள்ளன.
Industry:Computer; Software
ஒரு குறி என்று பயன்படுத்தப்படுகிறது எவ்வாறு ஒரு உரை உள்ளது chanted அல்லது sung காட்டுகிறது.
Industry:Computer; Software
பெரிய எழுத்து க்கான இணை சொல்.
Industry:Computer; Software
இந்த சங்கம், பெரிய, சிறிய மற்றும் titlecase படிவங்கள் கடிதம்.
Industry:Computer; Software
எழுத்து c இருக்க வேண்டும் வழக்கு ignorable சி MidLetter மதிப்பு உள்ளது அல்லது MidNumLet மதிப்பு Word_Break சொத்து அல்லது அதன் General_Category ஒன்றாகும் Nonspacing_Mark (Mn), Enclosing_Mark (எனக்கு), வடிவமைப்பு (Cf), Modifier_Letter (Lm) அல்லது Modifier_Symbol (அப்போதய) வரையறுக்கப்படவில்லை.
Industry:Computer; Software
பூஜ்யம் அல்லது மேற்பட்ட வழக்கு ignorable கேரக்டர்களை வரிசைமுறையை.
Industry:Computer; Software