Created
September 5, 2019 06:35
Star
You must be signed in to star a gist
Unicode Dictionary for Slugifying / Hyphenating URLs (see https://github.com/danieldietrich/slugify)
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
// A subset of Unicode version 12.0 | |
// https://en.wikipedia.org/wiki/List_of_Unicode_characters | |
// https://en.wiktionary.org/wiki | |
// Identity translations a-zA-Z0-9 and most punctuations are suppressed. | |
// Units and currencies and some are translated. | |
const unicode = { | |
"Basic Latin": { | |
// ASCII Punctuation & Symbols | |
'$': 'dollar', | |
'%': 'percent', | |
'&': 'and', | |
// ASCII Punctuation & Symbols | |
'<': 'less', | |
'=': 'equals', | |
'>': 'greater', | |
}, | |
"Latin-1 Supplement": { | |
// Latin-1 Punctuation & Symbols | |
'¢': 'cent', | |
'£': 'pound', | |
'¤': 'currency', | |
'¥': 'yen', | |
'©': 'c', | |
'®': 'tm', // not RMT | |
'°': 'degree', // not 0 | |
'±': 'plusminus', | |
'²': '2', | |
'³': '3', | |
'µ': 'micro', | |
'¹': '1', | |
'¼': 'quarter', | |
'½': 'half', | |
'¾': '3fourths', | |
// Letters: Uppercase | |
'À': 'A', | |
'Á': 'A', | |
'Â': 'A', | |
'Ã': 'A', | |
'Ä': 'Ae', // german umlaut | |
'Å': 'A', | |
'Æ': 'AE', | |
'Ç': 'C', | |
'È': 'E', | |
'É': 'E', | |
'Ê': 'E', | |
'Ë': 'E', | |
'Ì': 'I', | |
'Í': 'I', | |
'Î': 'I', | |
'Ï': 'I', | |
'Ð': 'D', | |
'Ñ': 'N', | |
'Ò': 'O', | |
'Ó': 'O', | |
'Ô': 'O', | |
'Õ': 'O', | |
'Ö': 'Oe', // german umlaut | |
// Math | |
'×': 'x', // not times | |
// Letters: Uppercase | |
'Ø': 'O', | |
'Ù': 'U', | |
'Ú': 'U', | |
'Û': 'U', | |
'Ü': 'Ue', // german umlaut | |
'Ý': 'Y', | |
'Þ': 'TH', | |
// Letters: Lowercase | |
'ß': 'ss', | |
'à': 'a', | |
'á': 'a', | |
'â': 'a', | |
'ã': 'a', | |
'ä': 'ae', // german umlaut | |
'å': 'a', | |
'æ': 'ae', | |
'ç': 'c', | |
'è': 'e', | |
'é': 'e', | |
'ê': 'e', | |
'ë': 'e', | |
'ì': 'i', | |
'í': 'i', | |
'î': 'i', | |
'ï': 'i', | |
'ð': 'd', | |
'ñ': 'n', | |
'ò': 'o', | |
'ó': 'o', | |
'ô': 'o', | |
'õ': 'o', | |
'ö': 'oe', // german umlaut | |
// Math | |
'÷': 'div', // not division | |
// Letters: Lowercase | |
'ø': 'o', | |
'ù': 'u', | |
'ú': 'u', | |
'û': 'u', | |
'ü': 'ue', // german umlaut | |
'ý': 'y', | |
'þ': 'th', | |
'ÿ': 'y', | |
}, | |
"Latin Extended-A": { | |
// European Latin | |
'Ā': 'A', | |
'ā': 'a', | |
'Ă': 'A', | |
'ă': 'a', | |
'Ą': 'A', | |
'ą': 'a', | |
'Ć': 'C', | |
'ć': 'c', | |
'Ĉ': 'C', | |
'ĉ': 'c', | |
'Ċ': 'C', | |
'ċ': 'c', | |
'Č': 'C', | |
'č': 'c', | |
'Ď': 'D', | |
'ď': 'd', | |
'Đ': 'D', | |
'đ': 'd', | |
'Ē': 'E', | |
'ē': 'e', | |
'Ĕ': 'E', | |
'ĕ': 'e', | |
'Ė': 'E', | |
'ė': 'e', | |
'Ę': 'E', | |
'ę': 'e', | |
'Ě': 'E', | |
'ě': 'e', | |
'Ĝ': 'G', | |
'ĝ': 'g', | |
'Ğ': 'G', | |
'ğ': 'g', | |
'Ġ': 'G', | |
'ġ': 'g', | |
'Ģ': 'G', | |
'ģ': 'g', | |
'Ĥ': 'H', | |
'ĥ': 'h', | |
'Ħ': 'H', | |
'ħ': 'h', | |
'Ĩ': 'I', | |
'ĩ': 'i', | |
'Ī': 'I', | |
'ī': 'i', | |
'Ĭ': 'I', | |
'ĭ': 'i', | |
'Į': 'I', | |
'į': 'i', | |
'İ': 'I', | |
'ı': 'i', | |
'IJ': 'IJ', | |
'ij': 'ij', | |
'Ĵ': 'J', | |
'ĵ': 'j', | |
'Ķ': 'K', | |
'ķ': 'k', | |
'ĸ': 'k', | |
'Ĺ': 'L', | |
'ĺ': 'l', | |
'Ļ': 'L', | |
'ļ': 'l', | |
'Ľ': 'L', | |
'ľ': 'l', | |
'Ŀ': 'L', | |
'ŀ': 'l', | |
'Ł': 'L', | |
'ł': 'l', | |
'Ń': 'N', | |
'ń': 'n', | |
'Ņ': 'N', | |
'ņ': 'n', | |
'Ň': 'N', | |
'ň': 'n', | |
'ʼn': 'n', | |
'Ŋ': 'N', | |
'ŋ': 'n', | |
'Ō': 'O', | |
'ō': 'o', | |
'Ŏ': 'O', | |
'ŏ': 'o', | |
'Ő': 'O', | |
'ő': 'o', | |
'Œ': 'OE', | |
'œ': 'oe', | |
'Ŕ': 'R', | |
'ŕ': 'r', | |
'Ŗ': 'R', | |
'ŗ': 'r', | |
'Ř': 'R', | |
'ř': 'r', | |
'Ś': 'S', | |
'ś': 's', | |
'Ŝ': 'S', | |
'ŝ': 's', | |
'Ş': 'S', | |
'ş': 's', | |
'Š': 'S', | |
'š': 's', | |
'Ţ': 'T', | |
'ţ': 't', | |
'Ť': 'T', | |
'ť': 't', | |
'Ŧ': 'T', | |
'ŧ': 't', | |
'Ũ': 'U', | |
'ũ': 'u', | |
'Ū': 'U', | |
'ū': 'u', | |
'Ŭ': 'U', | |
'ŭ': 'u', | |
'Ů': 'U', | |
'ů': 'u', | |
'Ű': 'U', | |
'ű': 'u', | |
'Ų': 'U', | |
'ų': 'u', | |
'Ŵ': 'W', | |
'ŵ': 'w', | |
'Ŷ': 'Y', | |
'ŷ': 'y', | |
'Ÿ': 'Y', | |
'Ź': 'Z', | |
'ź': 'z', | |
'Ż': 'Z', | |
'ż': 'z', | |
'Ž': 'Z', | |
'ž': 'z', | |
'ſ': 's', | |
}, | |
"Latin Extended-B": { | |
// Non-European & historic Latin | |
'ƀ': 'b', | |
'Ɓ': 'B', | |
'Ƃ': 'B', | |
'ƃ': 'b', | |
'Ƅ': 'B', | |
'ƅ': 'b', | |
'Ɔ': 'O', | |
'Ƈ': 'C', | |
'ƈ': 'c', | |
'Ɖ': 'D', | |
'Ɗ': 'D', | |
'Ƌ': 'D', | |
'ƌ': 'd', | |
'ƍ': 'delta', | |
'Ǝ': 'E', | |
'Ə': 'E', // Schwa, pronounced /i:/ | |
'Ɛ': 'E', | |
'Ƒ': 'F', | |
'ƒ': 'f', | |
'Ɠ': 'G', | |
'Ɣ': 'G', | |
'ƕ': 'hv', // Hwair, pronounced /hʷ/ | |
'Ɩ': 'I', | |
'Ɨ': 'I', | |
'Ƙ': 'K', | |
'ƙ': 'k', | |
'ƚ': 'l', | |
'ƛ': 'l', | |
'Ɯ': 'M', | |
'Ɲ': 'N', | |
'ƞ': 'n', | |
'Ɵ': 'O', | |
'Ơ': 'O', | |
'ơ': 'o', | |
'Ƣ': 'OI', // Gha | |
'ƣ': 'io', // Gha | |
'Ƥ': 'P', | |
'ƥ': 'p', | |
'Ʀ': 'YR', // Uvular trill | |
'Ƨ': 'S', | |
'ƨ': 's', | |
'Ʃ': 'S', // Esh | |
'ƪ': 'S', // reversed Esh | |
'ƫ': 't', | |
'Ƭ': 'T', | |
'ƭ': 't', | |
'Ʈ': 'T', | |
'Ư': 'U', | |
'ư': 'u', | |
'Ʊ': 'U', // Upsilon | |
'Ʋ': 'V', | |
'Ƴ': 'Y', | |
'ƴ': 'y', | |
'Ƶ': 'Z', | |
'ƶ': 'z', | |
'Ʒ': 'Z', // Ezh | |
'Ƹ': 'Z', // reversed Ezh | |
'ƹ': 'z', // reversed Ezh | |
'ƺ': 'z', | |
'ƻ': 'dz', | |
'Ƽ': '5', // Zhuang, spelled 'Q' | |
'ƽ': '5', // Zhuang, spelled 'q' | |
'ƾ': 'ts', | |
'ƿ': 'p', // pynn (wynn) | |
// Croatian | |
'DŽ': 'DZ', | |
'Dž': 'Dz', | |
'dž': 'dz', | |
'LJ': 'LJ', | |
'Lj': 'Lj', | |
'lj': 'lj', | |
'NJ': 'NJ', | |
'Nj': 'Nj', | |
'nj': 'nj', | |
// Pinyin | |
'Ǎ': 'A', | |
'ǎ': 'a', | |
'Ǐ': 'I', | |
'ǐ': 'i', | |
'Ǒ': 'O', | |
'ǒ': 'o', | |
'Ǔ': 'U', | |
'ǔ': 'u', | |
'Ǖ': 'U', | |
'ǖ': 'u', | |
'Ǘ': 'U', | |
'ǘ': 'u', | |
'Ǚ': 'U', | |
'ǚ': 'u', | |
'Ǜ': 'U', | |
'ǜ': 'u', | |
// Phonetic & historic letters | |
'ǝ': 'e', | |
'Ǟ': 'A', | |
'ǟ': 'a', | |
'Ǡ': 'A', | |
'ǡ': 'a', | |
'Ǣ': 'AE', | |
'ǣ': 'ae', | |
'Ǥ': 'G', | |
'ǥ': 'g', | |
'Ǧ': 'G', | |
'ǧ': 'g', | |
'Ǩ': 'K', | |
'ǩ': 'k', | |
'Ǫ': 'O', | |
'ǫ': 'o', | |
'Ǭ': 'O', | |
'ǭ': 'o', | |
'Ǯ': 'Z', // Ezh | |
'ǯ': 'z', // Ezh | |
'ǰ': 'j', | |
'DZ': 'DZ', | |
'Dz': 'Dz', | |
'dz': 'dz', | |
'Ǵ': 'G', | |
'ǵ': 'g', | |
'Ƕ': 'HV', // Hwair, pronounced /hʷ/ | |
'Ƿ': 'P', // Pynn (Wynn) | |
'Ǹ': 'N', | |
'ǹ': 'n', | |
'Ǻ': 'A', | |
'ǻ': 'a', | |
'Ǽ': 'AE', | |
'ǽ': 'ae', | |
'Ǿ': 'O', | |
'ǿ': 'o', | |
// Slovenian & Croatian | |
'Ȁ': 'A', | |
'ȁ': 'a', | |
'Ȃ': 'A', | |
'ȃ': 'a', | |
'Ȅ': 'E', | |
'ȅ': 'e', | |
'Ȇ': 'E', | |
'ȇ': 'e', | |
'Ȉ': 'I', | |
'ȉ': 'i', | |
'Ȋ': 'I', | |
'ȋ': 'i', | |
'Ȍ': 'O', | |
'ȍ': 'o', | |
'Ȏ': 'O', | |
'ȏ': 'o', | |
'Ȑ': 'R', | |
'ȑ': 'r', | |
'Ȓ': 'R', | |
'ȓ': 'r', | |
'Ȕ': 'U', | |
'ȕ': 'u', | |
'Ȗ': 'U', | |
'ȗ': 'u', | |
// Romanian | |
'Ș': 'S', | |
'ș': 's', | |
'Ț': 'T', | |
'ț': 't', | |
// Miscellaneous | |
'Ȝ': 'Y', // Yogh | |
'ȝ': 'y', // yogh | |
'Ȟ': 'H', | |
'ȟ': 'h', | |
'Ƞ': 'N', | |
'ȡ': 'd', | |
'Ȣ': 'OU', | |
'ȣ': 'ou', | |
'Ȥ': 'Z', | |
'ȥ': 'z', | |
'Ȧ': 'A', | |
'ȧ': 'a', | |
'Ȩ': 'E', | |
'ȩ': 'e', | |
// Livonian | |
'Ȫ': 'O', | |
'ȫ': 'o', | |
'Ȭ': 'O', | |
'ȭ': 'o', | |
'Ȯ': 'O', | |
'ȯ': 'o', | |
'Ȱ': 'O', | |
'ȱ': 'o', | |
'Ȳ': 'Y', | |
'ȳ': 'y', | |
// Sinology | |
'ȴ': 'l', | |
'ȵ': 'n', | |
'ȶ': 't', | |
// Miscellaneous | |
'ȷ': 'j', | |
'ȸ': 'db', | |
'ȹ': 'qp', | |
'Ⱥ': 'A', | |
'Ȼ': 'C', | |
'ȼ': 'c', | |
'Ƚ': 'L', | |
'Ⱦ': 'T', | |
'ȿ': 's', | |
'ɀ': 'z', | |
// 'Ɂ': '?', // Glottal stop sound | |
// 'ɂ': '?', // Glottal stop sound | |
'Ƀ': 'B', | |
'Ʉ': 'U', | |
'Ʌ': 'U', // short 'u', /ʌ/ | |
'Ɇ': 'E', | |
'ɇ': 'e', | |
'Ɉ': 'J', | |
'ɉ': 'j', | |
'Ɋ': 'Q', | |
'ɋ': 'q', | |
'Ɍ': 'R', | |
'ɍ': 'r', | |
'Ɏ': 'Y', | |
'ɏ': 'y', | |
}, | |
"Greek": { | |
'Ͱ': 'H', | |
'ͱ': 'h', | |
// 'Ͳ': '', | |
// 'ͳ': '', | |
// 'Ͷ': '', | |
// 'ͷ': '', | |
// 'ͻ': '', | |
// 'ͼ': '', | |
// 'ͽ': '', | |
'Ϳ': 'J', | |
'Ά': 'A', | |
'Έ': 'E', | |
'Ή': 'H', // Eta, not 'I' | |
'Ί': 'I', | |
'Ό': 'O', | |
'Ύ': 'Y', | |
'Ώ': 'W', | |
'ΐ': 'i', | |
'Α': 'A', | |
'Β': 'B', | |
'Γ': 'G', | |
'Δ': 'D', | |
'Ε': 'E', | |
'Ζ': 'Z', | |
'Η': 'H', // Eta, not 'I' | |
'Θ': 'TH', | |
'Ι': 'I', | |
'Κ': 'K', | |
'Λ': 'L', | |
'Μ': 'M', | |
'Ν': 'N', | |
'Ξ': 'X', // Xi | |
'Ο': 'O', | |
'Π': 'P', | |
'Ρ': 'R', | |
'Σ': 'S', | |
'Τ': 'T', | |
'Υ': 'Y', | |
'Φ': 'F', | |
'Χ': 'X', | |
'Ψ': 'PS', | |
'Ω': 'W', // not 'O' | |
'Ϊ': 'I', | |
'Ϋ': 'Y', | |
'ά': 'a', | |
'έ': 'e', | |
'ή': 'h', // eta, not 'i' | |
'ί': 'i', | |
'ΰ': 'y', | |
'α': 'a', | |
'β': 'b', | |
'γ': 'g', | |
'δ': 'd', | |
'ε': 'e', | |
'ζ': 'z', | |
'η': 'h', // eta, not 'i' | |
'θ': 'th', | |
'ι': 'i', | |
'κ': 'k', | |
'λ': 'l', | |
'μ': 'm', | |
'ν': 'n', | |
'ξ': 'x', // xi | |
'ο': 'o', | |
'π': 'p', | |
'ρ': 'r', | |
'ς': 's', | |
'σ': 's', | |
'τ': 't', | |
'υ': 'y', | |
'φ': 'f', | |
'χ': 'x', | |
'ψ': 'ps', | |
'ω': 'w', // not 'o' | |
'ϊ': 'i', | |
'ϋ': 'y', | |
'ό': 'o', | |
'ύ': 'y', | |
'ώ': 'w', | |
// 'Ϗ': '&', | |
'ϐ': 'B', // capital? | |
'ϑ': 'th', // ? | |
'ϒ': 'Y', // capital? | |
'ϓ': 'Y', // capital? | |
'ϔ': 'Y', // capital? | |
'ϕ': 'f', | |
'ϖ': 'p', | |
// 'ϗ': '&', | |
'Ϙ': 'Q', | |
'ϙ': 'q', | |
// 'Ϛ': '', | |
// 'ϛ': '', | |
// 'Ϝ': '', | |
// 'ϝ': '', | |
// 'Ϟ': '', | |
// 'ϟ': '', | |
// 'Ϡ': '', | |
// 'ϡ': '', | |
'ϰ': 'k', | |
'ϱ': 'r', | |
'ϲ': 's', | |
'ϳ': 'j', | |
'ϴ': 'Q', | |
'ϵ': 'e', | |
'϶': 'e', | |
'Ϸ': 'SH', | |
'ϸ': 'sh', | |
'Ϲ': 'S', | |
'Ϻ': 'S', | |
'ϻ': 's', | |
'ϼ': 'r', | |
// 'Ͻ': '', | |
// 'Ͼ': '', | |
// 'Ͽ': '' | |
}, | |
"Latin Extended Additional": { | |
'Ḁ': 'A', | |
'ḁ': 'a', | |
'Ḃ': 'B', | |
'ḃ': 'b', | |
'Ḅ': 'B', | |
'ḅ': 'b', | |
'Ḇ': 'B', | |
'ḇ': 'b', | |
'Ḉ': 'C', | |
'ḉ': 'c', | |
'Ḋ': 'D', | |
'ḋ': 'd', | |
'Ḍ': 'D', | |
'ḍ': 'd', | |
'Ḏ': 'D', | |
'ḏ': 'd', | |
'Ḑ': 'D', | |
'ḑ': 'd', | |
'Ḓ': 'D', | |
'ḓ': 'd', | |
'Ḕ': 'E', | |
'ḕ': 'e', | |
'Ḗ': 'E', | |
'ḗ': 'e', | |
'Ḙ': 'E', | |
'ḙ': 'e', | |
'Ḛ': 'E', | |
'ḛ': 'e', | |
'Ḝ': 'E', | |
'ḝ': 'e', | |
'Ḟ': 'F', | |
'ḟ': 'f', | |
'Ḡ': 'G', | |
'ḡ': 'g', | |
'Ḣ': 'H', | |
'ḣ': 'h', | |
'Ḥ': 'H', | |
'ḥ': 'h', | |
'Ḧ': 'H', | |
'ḧ': 'h', | |
'Ḩ': 'H', | |
'ḩ': 'h', | |
'Ḫ': 'H', | |
'ḫ': 'h', | |
'Ḭ': 'I', | |
'ḭ': 'i', | |
'Ḯ': 'I', | |
'ḯ': 'i', | |
'Ḱ': 'K', | |
'ḱ': 'k', | |
'Ḳ': 'K', | |
'ḳ': 'k', | |
'Ḵ': 'K', | |
'ḵ': 'k', | |
'Ḷ': 'L', | |
'ḷ': 'l', | |
'Ḹ': 'L', | |
'ḹ': 'l', | |
'Ḻ': 'L', | |
'ḻ': 'l', | |
'Ḽ': 'L', | |
'ḽ': 'l', | |
'Ḿ': 'M', | |
'ḿ': 'm', | |
'Ṁ': 'M', | |
'ṁ': 'm', | |
'Ṃ': 'M', | |
'ṃ': 'm', | |
'Ṅ': 'N', | |
'ṅ': 'n', | |
'Ṇ': 'N', | |
'ṇ': 'n', | |
'Ṉ': 'N', | |
'ṉ': 'n', | |
'Ṋ': 'N', | |
'ṋ': 'n', | |
'Ṍ': 'O', | |
'ṍ': 'o', | |
'Ṏ': 'O', | |
'ṏ': 'o', | |
'Ṑ': 'O', | |
'ṑ': 'o', | |
'Ṓ': 'O', | |
'ṓ': 'o', | |
'Ṕ': 'P', | |
'ṕ': 'p', | |
'Ṗ': 'P', | |
'ṗ': 'p', | |
'Ṙ': 'R', | |
'ṙ': 'r', | |
'Ṛ': 'R', | |
'ṛ': 'r', | |
'Ṝ': 'R', | |
'ṝ': 'r', | |
'Ṟ': 'R', | |
'ṟ': 'r', | |
'Ṡ': 'S', | |
'ṡ': 's', | |
'Ṣ': 'S', | |
'ṣ': 's', | |
'Ṥ': 'S', | |
'ṥ': 's', | |
'Ṧ': 'S', | |
'ṧ': 's', | |
'Ṩ': 'S', | |
'ṩ': 's', | |
'Ṫ': 'T', | |
'ṫ': 't', | |
'Ṭ': 'T', | |
'ṭ': 't', | |
'Ṯ': 'T', | |
'ṯ': 't', | |
'Ṱ': 'T', | |
'ṱ': 't', | |
'Ṳ': 'U', | |
'ṳ': 'u', | |
'Ṵ': 'U', | |
'ṵ': 'u', | |
'Ṷ': 'U', | |
'ṷ': 'u', | |
'Ṹ': 'U', | |
'ṹ': 'u', | |
'Ṻ': 'U', | |
'ṻ': 'u', | |
'Ṽ': 'V', | |
'ṽ': 'v', | |
'Ṿ': 'V', | |
'ṿ': 'v', | |
'Ẁ': 'W', | |
'ẁ': 'w', | |
'Ẃ': 'W', | |
'ẃ': 'w', | |
'Ẅ': 'W', | |
'ẅ': 'w', | |
'Ẇ': 'W', | |
'ẇ': 'w', | |
'Ẉ': 'W', | |
'ẉ': 'w', | |
'Ẋ': 'X', | |
'ẋ': 'x', | |
'Ẍ': 'X', | |
'ẍ': 'x', | |
'Ẏ': 'Y', | |
'ẏ': 'y', | |
'Ẑ': 'Z', | |
'ẑ': 'z', | |
'Ẓ': 'Z', | |
'ẓ': 'z', | |
'Ẕ': 'Z', | |
'ẕ': 'z', | |
'ẖ': 'h', | |
'ẗ': 't', | |
'ẘ': 'w', | |
'ẙ': 'y', | |
'ẚ': 'a', | |
'ẛ': 's', | |
'ẜ': 's', | |
'ẝ': 's', | |
'ẞ': 'SS', | |
'ẟ': 'delta', | |
'Ạ': 'A', | |
'ạ': 'a', | |
'Ả': 'A', | |
'ả': 'a', | |
'Ấ': 'A', | |
'ấ': 'a', | |
'Ầ': 'A', | |
'ầ': 'a', | |
'Ẩ': 'A', | |
'ẩ': 'a', | |
'Ẫ': 'A', | |
'ẫ': 'a', | |
'Ậ': 'A', | |
'ậ': 'a', | |
'Ắ': 'A', | |
'ắ': 'a', | |
'Ằ': 'A', | |
'ằ': 'a', | |
'Ẳ': 'A', | |
'ẳ': 'a', | |
'Ẵ': 'A', | |
'ẵ': 'a', | |
'Ặ': 'A', | |
'ặ': 'a', | |
'Ẹ': 'E', | |
'ẹ': 'e', | |
'Ẻ': 'E', | |
'ẻ': 'e', | |
'Ẽ': 'E', | |
'ẽ': 'e', | |
'Ế': 'E', | |
'ế': 'e', | |
'Ề': 'E', | |
'ề': 'e', | |
'Ể': 'E', | |
'ể': 'e', | |
'Ễ': 'E', | |
'ễ': 'e', | |
'Ệ': 'E', | |
'ệ': 'e', | |
'Ỉ': 'I', | |
'ỉ': 'i', | |
'Ị': 'I', | |
'ị': 'i', | |
'Ọ': 'O', | |
'ọ': 'o', | |
'Ỏ': 'O', | |
'ỏ': 'o', | |
'Ố': 'O', | |
'ố': 'o', | |
'Ồ': 'O', | |
'ồ': 'o', | |
'Ổ': 'O', | |
'ổ': 'o', | |
'Ỗ': 'O', | |
'ỗ': 'o', | |
'Ộ': 'O', | |
'ộ': 'o', | |
'Ớ': 'O', | |
'ớ': 'o', | |
'Ờ': 'O', | |
'ờ': 'o', | |
'Ở': 'O', | |
'ở': 'o', | |
'Ỡ': 'O', | |
'ỡ': 'o', | |
'Ợ': 'O', | |
'ợ': 'o', | |
'Ụ': 'U', | |
'ụ': 'u', | |
'Ủ': 'U', | |
'ủ': 'u', | |
'Ứ': 'U', | |
'ứ': 'u', | |
'Ừ': 'U', | |
'ừ': 'u', | |
'Ử': 'U', | |
'ử': 'u', | |
'Ữ': 'U', | |
'ữ': 'u', | |
'Ự': 'U', | |
'ự': 'u', | |
'Ỳ': 'Y', | |
'ỳ': 'y', | |
'Ỵ': 'Y', | |
'ỵ': 'y', | |
'Ỷ': 'Y', | |
'ỷ': 'y', | |
'Ỹ': 'Y', | |
'ỹ': 'y', | |
'Ỻ': 'LL', | |
'ỻ': 'll', | |
'Ỽ': 'V', | |
'ỽ': 'v', | |
'Ỿ': 'Y', | |
'ỿ': 'y', | |
}, | |
"General Punctuation": { | |
'‰': 'permille', | |
'‱': 'permyriad', | |
'⁒': 'minus', // commercial minus | |
}, | |
"Currency Symbols": { | |
'₠': 'ecu', | |
'₡': 'colon', | |
'₢': 'cruzeiro', | |
'₣': 'french franc', | |
'₤': 'lira', | |
'₥': 'mill', | |
'₦': 'naira', | |
'₧': 'peseta', | |
'₨': 'rupee', | |
'₩': 'won', | |
'₪': 'new shequel', | |
'₫': 'dong', | |
'€': 'euro', | |
'₭': 'kip', | |
'₮': 'tugrik', | |
'₯': 'drachma', | |
'₰': 'german penny', | |
'₱': 'peso', | |
'₲': 'guarani', | |
'₳': 'austral', | |
'₴': 'hryvnia', | |
'₵': 'cedi', | |
'₶': 'livre tournois', | |
'₷': 'spesmilo', | |
'₸': 'tenge', | |
'₹': 'indian rupee', | |
'₺': 'turkish lira', | |
'₻': 'nordic mark', | |
'₼': 'manat', | |
'₽': 'ruble', | |
'₾': 'lari', | |
'₿': 'bitcoin', | |
}, | |
"Letterlike Symbols": { | |
'℀': 'ac', // account of | |
'℁': 'as', // addressed to the subject | |
'ℂ': 'C', | |
'℃': 'C', // degree celsius | |
'℄': 'cl', // center line | |
'℅': 'co', // care of | |
'℆': 'cu', // cada una | |
'ℇ': 'e', // euler constant | |
'℈': 'Scr', // scruple unit | |
'℉': 'F', // degree fahrenheit | |
'ℊ': 'g', | |
'ℋ': 'H', | |
'ℌ': 'H', | |
'ℍ': 'H', | |
'ℎ': 'h', | |
'ℏ': 'h', | |
'ℐ': 'I', | |
'ℑ': 'I', | |
'ℒ': 'L', | |
'ℓ': 'l', | |
'℔': 'lb', | |
'ℕ': 'N', | |
'№': 'No', // Numero | |
'℗': 'p', // published, phonerecord, copyright | |
'℘': 'P', | |
'ℙ': 'P', | |
'ℚ': 'Q', | |
'ℛ': 'R', | |
'ℜ': 'R', | |
'ℝ': 'R', | |
'℞': 'R', | |
'℟': 'R', | |
'℠': 'sm', | |
'℡': 'tel', | |
'™': 'tm', | |
'℣': 'V', | |
'ℤ': 'Z', | |
'℥': 'oz', | |
'Ω': 'ohm', | |
'℧': 'mho', // inverted ohm | |
'ℨ': 'Z', | |
'℩': 'i', | |
'K': 'K', // celvin | |
'Å': 'A', | |
'ℬ': 'B', | |
'ℭ': 'C', | |
'℮': 'e', | |
'ℯ': 'e', | |
'ℰ': 'E', | |
'ℱ': 'F', | |
'Ⅎ': 'F', | |
'ℳ': 'M', | |
'ℴ': 'o', | |
// Hebrew | |
'ℵ': 'A', // alef | |
'ℶ': 'B', // bet | |
'ℷ': 'G', // gimel | |
'ℸ': 'D', // dalet | |
// Additional | |
'ℹ': 'i', | |
'℺': 'Q', | |
'℻': 'fax', | |
'ℼ': 'p', // pi | |
'ℽ': 'g', // gamma | |
'ℾ': 'G', // Gamma | |
'ℿ': 'P', // Pi | |
'⅀': 'S', | |
'⅁': 'G', | |
'⅂': 'L', | |
'⅃': 'L', | |
'⅄': 'Y', | |
'ⅅ': 'D', | |
'ⅆ': 'd', | |
'ⅇ': 'e', | |
'ⅈ': 'i', | |
'ⅉ': 'j', | |
'⅊': 'pl', // property line | |
'⅋': 'and', | |
'⅌': 'per', | |
'⅍': 'AS', // AKTIESELSKAB | |
'ⅎ': 'f', | |
// '⅏': '', Samaritan source | |
}, | |
"Number Forms": { | |
// Fractions | |
'⅐': 'one7th', // not seventh (like 7.) | |
'⅑': 'one9th', | |
'⅒': 'one10th', | |
'⅓': 'one3rd', | |
'⅔': 'two3rds', | |
'⅕': 'one5th', | |
'⅖': 'two5ths', | |
'⅗': 'three5ths', | |
'⅘': 'four5ths', | |
'⅙': 'one6th', | |
'⅚': 'five6ths', | |
'⅛': 'one8th', | |
'⅜': 'three8ths', | |
'⅝': 'five8ths', | |
'⅞': 'seven8ths', | |
'⅟': 'fraction', | |
// Roman numerals | |
'Ⅰ': 'I', | |
'Ⅱ': 'II', | |
'Ⅲ': 'III', | |
'Ⅳ': 'IV', | |
'Ⅴ': 'V', | |
'Ⅵ': 'VI', | |
'Ⅶ': 'VII', | |
'Ⅷ': 'VIII', | |
'Ⅸ': 'IX', | |
'Ⅹ': 'X', | |
'Ⅺ': 'XI', | |
'Ⅻ': 'XII', | |
'Ⅼ': 'L', | |
'Ⅽ': 'C', | |
'Ⅾ': 'D', | |
'Ⅿ': 'M', | |
'ⅰ': 'i', | |
'ⅱ': 'ii', | |
'ⅲ': 'iii', | |
'ⅳ': 'iv', | |
'ⅴ': 'v', | |
'ⅵ': 'vi', | |
'ⅶ': 'vii', | |
'ⅷ': 'viii', | |
'ⅸ': 'ix', | |
'ⅹ': 'x', | |
'ⅺ': 'xi', | |
'ⅻ': 'xii', | |
'ⅼ': 'l', | |
'ⅽ': 'c', | |
'ⅾ': 'd', | |
'ⅿ': 'm', | |
// Archaic Roman numerals | |
'ↀ': 'M', | |
'ↁ': 'Vk', | |
'ↂ': 'Xk', | |
'Ↄ': 'C', | |
// Lowercase Claudian letter | |
'ↄ': 'c', | |
'ↅ': '6', | |
'ↆ': 'L', | |
'ↇ': 'Lk', | |
'ↈ': 'Ck', | |
'↉': 'zero3rds', | |
// Turned digits | |
'↊': '2', | |
'↋': '3', | |
}, | |
"Arrows": { | |
'⇥': 'Tab', // #Keyboard | |
'⇧': 'Shift', // #Keyboard | |
'⇪': 'Capslock', // #Keyboard | |
}, | |
"Mathematical Operators": { | |
'∀': 'for all', | |
'∃': 'exists', | |
'∄': 'not exists', | |
'∅': 'empty set', | |
'∈': 'in', | |
'∉': 'not in', | |
'∊': 'in', | |
'∋': 'contains', | |
'∌': 'not contains', | |
'∍': 'contains', | |
'∎': 'QED', // Quod Erat Demonstrandum | |
'−': 'minus', | |
'∕': 'div', | |
'∖': 'minus', // set minus | |
'√': 'sqrt', // square root | |
'∛': 'cbrt', // cube root | |
'∞': 'infinity', | |
// Logical and set operators | |
'∧': 'and', | |
'∨': 'or', | |
'∩': 'intersect', | |
'∪': 'union', | |
'≪': 'much less', | |
'≫': 'much greater', | |
'⊂': 'subset', | |
'⊃': 'superset', | |
'⊄': 'not subset', | |
'⊅': 'not superset', | |
'⊆': 'subset or equal', | |
'⊇': 'superset or equal', | |
'⊈': 'not subset or equal', | |
'⊉': 'not superset or equal', | |
'⊊': 'subset not equal', | |
'⊋': 'superset not equal', | |
'⊢': 'implies', | |
'⊣': 'does not imply', | |
'⊤': 'verum', | |
'⊥': 'falsum', | |
'⋀': 'AND', // n-ary | |
'⋁': 'OR', // n-ary | |
'⋂': 'INTERSECT', // n-ary | |
'⋃': 'UNION', // n-ary | |
}, | |
"Miscellaneous Technical": { | |
'⌃': 'Control', // not 'power of' #Keyboard | |
'⌘': 'Command', // #Keyboard | |
'⌥': 'Option', // #Keyboard | |
'⌦': 'Delete', // #Keyboard | |
'⌫': 'Backspace', // #Keyboard | |
'⎇': 'Alt', // #Keyboard | |
'⎋': 'Esc', // #Keyboard | |
'⏎': 'Return', // #Keyboard | |
'⏏': 'Eject', // #Keyboard | |
}, | |
"Enclosed Alphanumerics": { | |
'①': '1', | |
'②': '2', | |
'③': '3', | |
'④': '4', | |
'⑤': '5', | |
'⑥': '6', | |
'⑦': '7', | |
'⑧': '8', | |
'⑨': '9', | |
'⑩': '10', | |
'⑪': '11', | |
'⑫': '12', | |
'⑬': '13', | |
'⑭': '14', | |
'⑮': '15', | |
'⑯': '16', | |
'⑰': '17', | |
'⑱': '18', | |
'⑲': '19', | |
'⑳': '20', | |
'⑴': '1', | |
'⑵': '2', | |
'⑶': '3', | |
'⑷': '4', | |
'⑸': '5', | |
'⑹': '6', | |
'⑺': '7', | |
'⑻': '8', | |
'⑼': '9', | |
'⑽': '10', | |
'⑾': '11', | |
'⑿': '12', | |
'⒀': '13', | |
'⒁': '14', | |
'⒂': '15', | |
'⒃': '16', | |
'⒄': '17', | |
'⒅': '18', | |
'⒆': '19', | |
'⒇': '20', | |
'⒈': '1', | |
'⒉': '2', | |
'⒊': '3', | |
'⒋': '4', | |
'⒌': '5', | |
'⒍': '6', | |
'⒎': '7', | |
'⒏': '8', | |
'⒐': '9', | |
'⒑': '10', | |
'⒒': '11', | |
'⒓': '12', | |
'⒔': '13', | |
'⒕': '14', | |
'⒖': '15', | |
'⒗': '16', | |
'⒘': '17', | |
'⒙': '18', | |
'⒚': '19', | |
'⒛': '20', | |
'⒜': 'a', | |
'⒝': 'b', | |
'⒞': 'c', | |
'⒟': 'd', | |
'⒠': 'e', | |
'⒡': 'f', | |
'⒢': 'g', | |
'⒣': 'h', | |
'⒤': 'i', | |
'⒥': 'j', | |
'⒦': 'k', | |
'⒧': 'l', | |
'⒨': 'm', | |
'⒩': 'n', | |
'⒪': 'o', | |
'⒫': 'p', | |
'⒬': 'q', | |
'⒭': 'r', | |
'⒮': 's', | |
'⒯': 't', | |
'⒰': 'u', | |
'⒱': 'v', | |
'⒲': 'w', | |
'⒳': 'x', | |
'⒴': 'y', | |
'⒵': 'z', | |
'Ⓐ': 'A', | |
'Ⓑ': 'B', | |
'Ⓒ': 'C', | |
'Ⓓ': 'D', | |
'Ⓔ': 'E', | |
'Ⓕ': 'F', | |
'Ⓖ': 'G', | |
'Ⓗ': 'H', | |
'Ⓘ': 'I', | |
'Ⓙ': 'J', | |
'Ⓚ': 'K', | |
'Ⓛ': 'L', | |
'Ⓜ': 'M', | |
'Ⓝ': 'N', | |
'Ⓞ': 'O', | |
'Ⓟ': 'P', | |
'Ⓠ': 'Q', | |
'Ⓡ': 'R', | |
'Ⓢ': 'S', | |
'Ⓣ': 'T', | |
'Ⓤ': 'U', | |
'Ⓥ': 'V', | |
'Ⓦ': 'W', | |
'Ⓧ': 'X', | |
'Ⓨ': 'Y', | |
'Ⓩ': 'Z', | |
'ⓐ': 'a', | |
'ⓑ': 'b', | |
'ⓒ': 'c', | |
'ⓓ': 'd', | |
'ⓔ': 'e', | |
'ⓕ': 'f', | |
'ⓖ': 'g', | |
'ⓗ': 'h', | |
'ⓘ': 'i', | |
'ⓙ': 'j', | |
'ⓚ': 'k', | |
'ⓛ': 'l', | |
'ⓜ': 'm', | |
'ⓝ': 'n', | |
'ⓞ': 'o', | |
'ⓟ': 'p', | |
'ⓠ': 'q', | |
'ⓡ': 'r', | |
'ⓢ': 's', | |
'ⓣ': 't', | |
'ⓤ': 'u', | |
'ⓥ': 'v', | |
'ⓦ': 'w', | |
'ⓧ': 'x', | |
'ⓨ': 'y', | |
'ⓩ': 'z', | |
'⓪': '0', | |
'⓫': '11', | |
'⓬': '12', | |
'⓭': '13', | |
'⓮': '14', | |
'⓯': '15', | |
'⓰': '16', | |
'⓱': '17', | |
'⓲': '18', | |
'⓳': '19', | |
'⓴': '20', | |
'⓵': '1', | |
'⓶': '2', | |
'⓷': '3', | |
'⓸': '4', | |
'⓹': '5', | |
'⓺': '6', | |
'⓻': '7', | |
'⓼': '8', | |
'⓽': '9', | |
'⓾': '10', | |
'⓿': '0', | |
}, | |
"Miscellaneous Symbols": { | |
'☎': 'phone', | |
'☏': 'phone', | |
'☑': 'check', | |
'☒': 'x', | |
'☓': 'x', | |
'☕': 'coffee', | |
'☠': 'death', | |
'☮': 'peace', | |
'☹': 'frown', | |
'☺': 'smile', | |
'☻': 'smile', | |
// Zodiac Signs | |
'♈': 'Aries', | |
'♉': 'Taurus', | |
'♊': 'Gemini', | |
'♋': 'Cancer', | |
'♌': 'Leo', | |
'♍': 'Virgo', | |
'♎': 'Libra', | |
'♏': 'Scorpio', | |
'♐': 'Sagittarius', | |
'♑': 'Capricorn', | |
'♒': 'Aquarius', | |
'♓': 'Pisces', | |
// Symbols | |
'♡': 'love', | |
'♥': 'love', | |
}, | |
"Dingbats": { | |
'✀': 'snip', // Black safety scissors | |
'✁': 'snip', | |
'✂': 'snip', | |
'✃': 'snip', | |
'✄': 'snip', | |
'✅': 'check', | |
'✆': 'phone', | |
'✓': 'check', | |
'✔': 'check', | |
'✕': 'x', | |
'✖': 'x', | |
'✗': 'x', | |
'✘': 'x', | |
'❌': 'x', | |
'❎': 'x', | |
'❤': 'love', | |
'❶': '1', | |
'❷': '2', | |
'❸': '3', | |
'❹': '4', | |
'❺': '5', | |
'❻': '6', | |
'❼': '7', | |
'❽': '8', | |
'❾': '9', | |
'❿': '10', | |
'➀': '1', | |
'➁': '2', | |
'➂': '3', | |
'➃': '4', | |
'➄': '5', | |
'➅': '6', | |
'➆': '7', | |
'➇': '8', | |
'➈': '9', | |
'➉': '10', | |
'➊': '1', | |
'➋': '2', | |
'➌': '3', | |
'➍': '4', | |
'➎': '5', | |
'➏': '6', | |
'➐': '7', | |
'➑': '8', | |
'➒': '9', | |
'➓': '10', | |
}, | |
"CJK Unified Ideographs": { | |
'元': 'yuan', | |
'円': 'yen', | |
}, | |
"Alphabetic Presentation Forms": { | |
'ff': 'ff', | |
'fi': 'fi', | |
'fl': 'fl', | |
'ffi': 'ffi', | |
'ffl': 'ffl', | |
'ſt': 'st', | |
'st': 'st', | |
}, | |
"Arabic Representation Forms-A": { | |
'﷼': 'rial', | |
}, | |
}; |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment