Skip to content

Instantly share code, notes, and snippets.

@BillKek
Created March 24, 2023 18:59
Show Gist options
  • Save BillKek/d39c4ed93088a87b15cd76346aae58f4 to your computer and use it in GitHub Desktop.
Save BillKek/d39c4ed93088a87b15cd76346aae58f4 to your computer and use it in GitHub Desktop.
условие рускости байтов в байтовой строке utf8
utf8 -- проамериканский стандарт кодировки букв, где их буквы имеют размер 1 байт, а всё выше 0x80 - чужие буквы и спецсимволы, их размер от 2 до 4 байтов, плюс всякие рушечки для букв.
русские буквы имеют первый байт равный 0xD0 или 0xD1, и второй байт тоже чему-то равен.
простое не 100% условие для русских букв в байтовом потоке:
((ch>=0x80)&&(ch<=0xBF))||(ch==0xD0)||(ch==0xD1)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment