tk_Cyrl_tk_BGN.txt (10365B)
1 # © 2016 and later: Unicode, Inc. and others. 2 # License & terms of use: http://www.unicode.org/copyright.html 3 # Generated using tools/cldr/cldr-to-icu/ 4 # 5 # File: tk_Cyrl_tk_BGN.txt 6 # Generated from CLDR 7 # 8 9 # 10 ######################################################################## 11 # BGN/PCGN 1979 System 12 # 13 # The BGN/PCGN system for Turkmen was designed for use in 14 # romanizing names written in the Turkmen alphabet. 15 # The Turkmen alphabet contains five letters not present 16 # in the Russian alphabet: Җҗ, Ңң, Өө, Үү, and Әә. 17 # 18 # The Turkmen Cyrillic Alphabet as defined by the BGN (Page 103): 19 # 20 # АБВГДЕЁЖҖЗИЙКЛМНҢОӨПРСТУҮФХЦЧШЩЪЫЬЭӘЮЯ 21 # абвгдеёжзҗийклмнңоөпрстуүфхцчшщъыьэәюя 22 # 23 # Originally prepared by Michael Everson <everson@evertype.com> 24 ######################################################################## 25 # 26 # MINIMAL FILTER: Turkmen-Latin 27 # 28 # :: [АБВГДЕЁЖҖЗИЙКЛМНҢОӨПРСТУҮФХЦЧШЩЪЫЬЭӘЮЯабвгдеёжзҗийклмнңоөпрстуүфхцчшщъыьэәюя] ; 29 :: NFD (NFC) ; 30 # 31 # 32 ######################################################################## 33 # 34 ######################################################################## 35 # 36 # Define All Transformation Variables 37 # 38 ######################################################################## 39 # 40 $prime = ʹ ; 41 $doublePrime = ʺ ; 42 $upperConsonants = [БВГДЖҖЗЙКЛМНҢПРСТФХЦЧШЩЪЬ] ; 43 $lowerConsonants = [бвгджҗзйклмнңпрстфхцчшщъь] ; 44 $consonants = [$upperConsonants $lowerConsonants] ; 45 $upperVowels = [АЕЁИОӨУҮЫЭӘЮЯ] ; 46 $lowerVowels = [аеёиоөуүыэәюя] ; 47 $vowels = [$upperVowels $lowerVowels] ; 48 $lower = [$lowerConsonants $lowerVowels] ; 49 # 50 # 51 # Use this $wordBoundary until bug 2034 is fixed in ICU: 52 # http://bugs.icu-project.org/cgi-bin/icu-bugs/transliterate?id=2034;expression=boundary;user=guest 53 # 54 $wordBoundary = [^[:L:][:M:][:N:] ] ; 55 # 56 # 57 ######################################################################## 58 # 59 ######################################################################## 60 # 61 # Start of Alphabetic Transformations 62 # 63 ######################################################################## 64 # 65 А → A ; # CYRILLIC CAPITAL LETTER A 66 а → a ; # CYRILLIC SMALL LETTER A 67 Б → B ; # CYRILLIC CAPITAL LETTER BE 68 б → b ; # CYRILLIC SMALL LETTER BE 69 В → W ; # CYRILLIC CAPITAL LETTER VE 70 в → w ; # CYRILLIC SMALL LETTER VE 71 Г → G ; # CYRILLIC CAPITAL LETTER GHE 72 г → g ; # CYRILLIC SMALL LETTER GHE 73 Д → D ; # CYRILLIC CAPITAL LETTER DE 74 д → d ; # CYRILLIC SMALL LETTER DE 75 # 76 # 77 ######################################################################## 78 # 79 # BGN Page 104 Rule 1: 80 # 81 # The character e should be romanized ye initially, after the vowel 82 # characters a, e, ё, и, о, ө, у, ү, ы, э, ю, and я, and after й, ъ, and ь. 83 # In all other instances, it should be romanized e. 84 # 85 ######################################################################## 86 # 87 Е}[[$upperVowels - [Ә] ] [ЙЪЬ] ] → YE ; # CYRILLIC CAPITAL LETTER IE 88 Е}[[$lowerVowels - [ә] ] [йъь] ] → Ye ; # CYRILLIC CAPITAL LETTER IE 89 $wordBoundary{Е → Ye ; # CYRILLIC CAPITAL LETTER IE 90 Е → E ; # CYRILLIC CAPITAL LETTER IE 91 е}[[$upperVowels - [Ә] ] [$lowerVowels - [ә] ] [ЙйЪъЬь] ] → ye ; # CYRILLIC SMALL LETTER IE 92 $wordBoundary{е → ye ; # CYRILLIC SMALL LETTER IE 93 е → e ; # CYRILLIC SMALL LETTER IE 94 # 95 # 96 ######################################################################## 97 # 98 # End of Rule 1 99 # 100 ######################################################################## 101 # 102 Ё} $lower → Yo ; # CYRILLIC CAPITAL LETTER IO 103 Ё → YO ; # CYRILLIC CAPITAL LETTER IO 104 ё → yo ; # CYRILLIC SMALL LETTER IO 105 Ж} $lower → Zh ; # CYRILLIC CAPITAL LETTER ZHE 106 Ж → ZH ; # CYRILLIC CAPITAL LETTER ZHE 107 ж → zh ; # CYRILLIC SMALL LETTER ZHE 108 # 109 # 110 ######################################################################## 111 # 112 # BGN Page 104 Rule 2 113 # 114 # The character sequences зх, нг, сх, and цх may be romanized z·h, 115 # n·g, s·h, and ts·h in order to differentiate those romanizations form 116 # the digraphs zh, ng, sh, and the letter sequence tsh, which are used 117 # to render the characters ж, ң, ш, and the character sequence тш. 118 # 119 ######################################################################## 120 # 121 ЗХ → Z·H ; # CYRILLIC CAPITAL LETTER ZE 122 Зх → Z·h ; # CYRILLIC CAPITAL LETTER ZE 123 зх → z·h ; # CYRILLIC SMALL LETTER ZE 124 З → Z ; # CYRILLIC CAPITAL LETTER ZE 125 з → z ; # CYRILLIC SMALL LETTER ZE 126 # 127 # 128 ######################################################################## 129 # 130 # End Rule 2 131 # 132 ######################################################################## 133 # 134 И → И ; # CYRILLIC CAPITAL LETTER I 135 и → и ; # CYRILLIC SMALL LETTER I 136 Й → Y ; # CYRILLIC CAPITAL LETTER I 137 й → y ; # CYRILLIC SMALL LETTER I 138 К → K ; # CYRILLIC CAPITAL LETTER KA 139 к → k ; # CYRILLIC SMALL LETTER KA 140 Л → L ; # CYRILLIC CAPITAL LETTER EL 141 л → l ; # CYRILLIC SMALL LETTER EL 142 М → M ; # CYRILLIC CAPITAL LETTER EM 143 м → m ; # CYRILLIC SMALL LETTER EM 144 # 145 # 146 ######################################################################## 147 # 148 # BGN Page 104 Rule 2 149 # 150 # нг becomes n·g 151 # 152 ######################################################################## 153 # 154 НГ → N·G ; # CYRILLIC CAPITAL LETTER EN 155 Нг → N·g ; # CYRILLIC CAPITAL LETTER EN 156 нг → n·g ; # CYRILLIC SMALL LETTER EN 157 Н → N ; # CYRILLIC CAPITAL LETTER EN 158 н → n ; # CYRILLIC SMALL LETTER EN 159 # 160 # 161 ######################################################################## 162 # 163 # End Rule 2 164 # 165 ######################################################################## 166 # 167 Ң} $lower → Ng ; # CYRILLIC CAPITAL LETTER EN WITH DESCENDER 168 Ң → NG ; # CYRILLIC CAPITAL LETTER EN WITH DESCENDER 169 ң → ng ; # CYRILLIC SMALL LETTER EN WITH DESCENDER 170 О → O ; # CYRILLIC CAPITAL LETTER O 171 о → o ; # CYRILLIC SMALL LETTER O 172 Ө → Ö ; # CYRILLIC CAPITAL LETTER BARRED O 173 ө → ö ; # CYRILLIC SMALL LETTER BARRED O 174 П → P ; # CYRILLIC CAPITAL LETTER PE 175 п → p ; # CYRILLIC SMALL LETTER PE 176 Р → R ; # CYRILLIC CAPITAL LETTER ER 177 р → r ; # CYRILLIC SMALL LETTER ER 178 # 179 # 180 ######################################################################## 181 # 182 # BGN Page 104 Rule 2 183 # 184 # сх becomes s·h 185 # 186 ######################################################################## 187 # 188 СХ → S·H ; # CYRILLIC CAPITAL LETTER ES 189 Сх → S·h ; # CYRILLIC CAPITAL LETTER ES 190 сх → s·h ; # CYRILLIC SMALL LETTER ES 191 С → S ; # CYRILLIC CAPITAL LETTER ES 192 с → s ; # CYRILLIC SMALL LETTER ES 193 # 194 # 195 ######################################################################## 196 # 197 # End Rule 2 198 # 199 ######################################################################## 200 # 201 Т → T ; # CYRILLIC CAPITAL LETTER TE 202 т → t ; # CYRILLIC SMALL LETTER TE 203 У → U ; # CYRILLIC CAPITAL LETTER U 204 у → u ; # CYRILLIC SMALL LETTER U 205 Ү → Ü ; # CYRILLIC CAPITAL LETTER STRAIGHT U 206 ү → ü ; # CYRILLIC SMALL LETTER STRAIGHT U 207 Ф → F ; # CYRILLIC CAPITAL LETTER EF 208 ф → f ; # CYRILLIC SMALL LETTER EF 209 Х → H ; # CYRILLIC CAPITAL LETTER HA 210 х → h ; # CYRILLIC SMALL LETTER HA 211 # 212 # 213 ######################################################################## 214 # 215 # BGN Page 104 Rule 2 216 # 217 # цх becomes ts·h 218 # 219 ######################################################################## 220 # 221 ЦХ → TS·H ; # CYRILLIC CAPITAL LETTER GHE 222 Цх → Ts·h ; # CYRILLIC CAPITAL LETTER GHE 223 цх → ts·h ; # CYRILLIC SMALL LETTER GHE 224 Ц} $lower → Ts ; # CYRILLIC CAPITAL LETTER TSE 225 Ц → TS ; # CYRILLIC CAPITAL LETTER TSE 226 ц → ts ; # CYRILLIC SMALL LETTER TSE 227 # 228 # 229 ######################################################################## 230 # 231 # End Rule 2 232 # 233 ######################################################################## 234 # 235 Ч} $lower → Ch ; # CYRILLIC CAPITAL LETTER CHE 236 Ч → CH ; # CYRILLIC CAPITAL LETTER CHE 237 ч → ch ; # CYRILLIC SMALL LETTER CHE 238 # 239 # 240 ######################################################################## 241 # 242 # Implied rule from BGN Russian-Latin transliteration (Page 94 Note 3.6). 243 # 244 # шч becomes sh·ch 245 # 246 ######################################################################## 247 # 248 ШЧ → SH·CH ; # CYRILLIC CAPITAL LETTER SHA 249 Шч → Sh·ch ; # CYRILLIC CAPITAL LETTER SHA 250 шч → sh·ch ; # CYRILLIC SMALL LETTER SHA 251 Ш} $lower → Sh ; # CYRILLIC CAPITAL LETTER SHA 252 Ш → SH ; # CYRILLIC CAPITAL LETTER SHA 253 ш → sh ; # CYRILLIC SMALL LETTER SHA 254 Щ} $lower → Shch ; # CYRILLIC CAPITAL LETTER SHCHA 255 Щ → SHCH ; # CYRILLIC CAPITAL LETTER SHCHA 256 щ → shch ; # CYRILLIC SMALL LETTER SHCHA 257 # 258 # 259 ######################################################################## 260 # 261 # End Implied rule 262 # 263 ######################################################################## 264 # 265 Ъ → $doublePrime ; # CYRILLIC CAPITAL LETTER HARD SIGN 266 ъ → $doublePrime ; # CYRILLIC SMALL LETTER HARD SIGN 267 # 268 # 269 ######################################################################## 270 # 271 # BGN Page 104 Note 3 272 # 273 # The character Ыы may be romanized Ɨɨ instead of Yy, if so desired. 274 # 275 ######################################################################## 276 # 277 Ы → Y ; # CYRILLIC CAPITAL LETTER YERU 278 ы → y ; # CYRILLIC SMALL LETTER YERU 279 # 280 # 281 # Alternative rule to implement the option described here. To apply 282 # uncomment the following by removing the '#' mark at the start of the 283 # line and insert before the two rule lines above. 284 # 285 #Ы → Ɨ ; # CYRILLIC CAPITAL LETTER YERU 286 #ы → ɨ ; # CYRILLIC SMALL LETTER YERU 287 # 288 ######################################################################## 289 # 290 # End BGN Page 104 Note 2 291 # 292 ######################################################################## 293 # 294 Ь → $prime ; # CYRILLIC CAPITAL LETTER SOFT SIGN 295 ь → $prime ; # CYRILLIC SMALL LETTER SOFT SIGN 296 Э → E ; # CYRILLIC CAPITAL LETTER E 297 э → e ; # CYRILLIC SMALL LETTER E 298 Ә → Ä ; # CYRILLIC CAPITAL LETTER SCHWA 299 ә → ä ; # CYRILLIC SMALL LETTER SCHWA 300 Ю} $lower → Yu ; # CYRILLIC CAPITAL LETTER YU 301 Ю → YU ; # CYRILLIC CAPITAL LETTER YU 302 ю → yu ; # CYRILLIC SMALL LETTER YU 303 Я} $lower → Ya ; # CYRILLIC CAPITAL LETTER YA 304 Я → YA ; # CYRILLIC CAPITAL LETTER YA 305 я → ya ; # CYRILLIC SMALL LETTER YA 306 # 307 # 308 ########################################################################