upload
The Unicode Consortium
Industry: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
Порядок серії байт визначається комп'ютерної архітектури.
Industry:Computer; Software
Розворот ордена послідовність байтів.
Industry:Computer; Software
(1) Відповідність з загальними правилами для кодування — тобто, не стиснутий, ущільнений або в будь-які інші форми зазначеного вище протоколу. (2) Характеристики нормативних зіставлення та форми еквівалентності, зазначені в главі 3, відповідності.
Industry:Computer; Software
Крок у алгоритму для кодування Юнікод нормалізації форми, під час якого розкладеному послідовностей замінені первинного композитів, де це можливо.
Industry:Computer; Software
Починаючи від другого символу в закодовані символів послідовність (канонічна розкладання або сумісності розкладання) і процес послідовно остаточний характер, виконайте такі дії: R1 шукати назад (вліво в закодовані символу послідовності від характеру c знайти останніх стартера l передували c послідовність символів). R2 якщо там є такі l і c не заблоковано L, і існує первинної композитні P, що еквівалентно канонічно послідовність &lt; L, C &gt;, то замінити L P в послідовності і видалити c з послідовності. *, Коли алгоритм завершує, всі номери заблокували пар канонічно еквівалентно первинного композитні буде систематично замінено на тих первинних композити. *Заміна R2, L Starter вимагає, продовжуючи перевірити подальші символи, поки символу в цій позиції уже не частиною будь-яких Non заблоковано пар, що може бути замінено первинного композитні. Наприклад, розглянемо наступну послідовність гіпотетичного закодовані характер: <u>. Ніхто з перших трьох об'єднання знаків формує основний складений з літера z. Однак, четвертий комбінування знака в послідовності, гострий, чи форми первинного складений з z і вона не заблоковано z. тому, R2 мандати заміна послідовність &lt; 007A U + z,... U + 0301, гострого &gt; з &lt; U + z гострий, 017A... &gt;, хоча існують три інші об'єднання знаків боронити подальший в послідовності. *Характер c у R1, не обов'язково не для початківців. Це необхідно, щоб перевірити всі знаки в послідовності, тому що існує послідовність &lt; L, C &gt; де l та c є закуски, поки існує первинної композитні P, еквівалентний канонічно що послідовність. Наприклад, індійської групи двох частин голосні часто мають канонічний декомпозицій моделі в послідовності з двох інтервал голосні знаків, кожен з яких має Canonical_Combining_Class &#61; 0 і які, таким чином, для початківців за визначенням. Однак, така розкладеному послідовність має на еквівалентні первинного композитні.
Industry:Computer; Software
Символ, який не ідентичне його канонічний розкладання. , Він також відомий як канонічний precomposed характер або канонічний композитного характер.Латинська мала буква *наприклад, U + 00E0 з могили є канонічним decomposable характер, тому що її канонічного розкладання послідовність <u>. U + 212A Кельвіна знак є канонічним decomposable характер, тому що її канонічного розкладання до Латинська велика буква U + 004B к.
Industry:Computer; Software
Зіставлення за своєю суттю еквівалентні послідовності — наприклад, для зіставлення буква a + поєднання умляут. Розкладання символ або послідовність символів, що результатів від рекурсивно застосування канонічний зіставлень в базу даних символів Unicode, поки немає символів можна далі розкласти і потім перепризначення nonspacing позначки.Канонічні розклад матриці a *не видалити форматування.
Industry:Computer; Software
Кажуть, що дві послідовності знаків бути канонічний еквіваленти, якщо їх повний канонічний декомпозицій моделі ідентичні. *Наприклад, послідовності &lt; o, комбінування (кирилиця-) &gt; і &lt;ö&gt; є канонічним еквіваленти. Канонічний еквівалентності є властивістю Юнікод. Це не слід плутати з конкретної мови сортування або зіставлення, яка може додати інші equivalencies. Наприклад, шведською, o розглядається як зовсім інший лист від o і взяті після z. В Німецька, o є слабкою еквівалент для первинної комплектації та звіряються з первинної комплектації. В Англійська, o є просто o з діакритичний знак, який вказує, що вона винесли окремо від попереднього лист (як у coöperate) і звіряються з о. *, за визначенням, всі канонічний еквівалент послідовності також сумісності еквівалент послідовності.
Industry:Computer; Software
В розкладеному символу послідовності d обмін позиції символів у кожному Reorderable парі, поки послідовність містить не більше Reorderable пар. *В силі, канонічні замовлення алгоритму є Місцевий пузир сортування, що гарантує, що канонічний розкладання або сумісності розкладання буде містити немає subsequences, Марк комбінування пішли безпосередньо на інший поєднання Марк, який має нижчою, ненульовий комбінування клас *Canonical замовлення визначається в умовах застосування канонічний замовлення алгоритм, щоб весь розкладеному послідовності. Наприклад, канонічні розкладання послідовність <u>призведе до послідовності &lt; U + 0064 Латинська мала буква d, U + 0307 об'єднання точка вище, U + 0323 об'єднання точка нижче &gt;, послідовності, яка є ще не в канонічному порядку. Більшості декомпозицій моделі для рядків Юнікод вже знаходяться в канонічному порядку.
Industry:Computer; Software
Знак, що використовується, щоб вказати, як текст скандували або співала.
Industry:Computer; Software