Skip to content

Instantly share code, notes, and snippets.

@pedrotnascimento
Last active July 29, 2017 18:25
Show Gist options
  • Save pedrotnascimento/8fdb5e3bc5bb92246bb68f200e5d5ab9 to your computer and use it in GitHub Desktop.
Save pedrotnascimento/8fdb5e3bc5bb92246bb68f200e5d5ab9 to your computer and use it in GitHub Desktop.
Solution for encoding problems of ANSI(common pattern in Windows) to UTF-8(Common use encoding) and from UTF-8 to ASCII(used in some contexts: data analisys)
La Coupe du monde de football ou Coupe du monde de la FIFA est une compétition internationale de football qui se déroule ordinairement tous les quatre ans. Cette compétition, créée en 1928 en France, sous l'impulsion de Jules Rimet alors président de la FIFA, est ouverte à toutes les fédérations reconnues par la Fédération internationale de football association (FIFA). La première édition se déroule en 1930 en Uruguay, dont l'équipe nationale sort vainqueur. À l'exception de la Coupe du monde de 1930, la compétition se tient en deux phases. Organisée par les confédérations continentales, la phase préliminaire permet aux meilleures sélections de chaque continent de se qualifier pour la phase finale qui se déroule dans un pays organisateur. Le format actuel de la phase finale fait s'affronter trente-deux équipes nationales masculines pendant une période d'environ un mois. Seules huit nations sont au palmarès de la Coupe du monde. Le Brésil, seule équipe à avoir disputé toutes les phases finales de compétition, détient le record d'éditions remportées avec cinq succès.
L’accent tonique du français est essentiellement démarcatif, c’est-à-dire qu’il découpe l’énoncé en unités de sens. Lorsqu’un mot est employé seul, l’accent tombe sur la dernière syllabe. Dans un énoncé, cependant, les mots sont répartis en groupes formant une unité syntaxique et sémantique (ou de sens), c’est-à-dire en syntagmes. L’accent principal est alors sur la dernière syllabe de chaque syntagme, éventuellement en alternance avec des accents secondaires, moins marqués, tombant sur la dernière syllabe de certains mots.
NÃO OLHE PARA A MÁQUINA! NÃO OLHE PARA O TECLADO! NÃO OLHE PARA O PAPEL! Olhe para o papel somente depois de terminar de digitar o texto, para verificar os erros.
Não precisa aprender a bater o teclado dos números. Aprenda a bater somente as lições do 1º, 2º e 3º teclados, respectivamente.
Poderá bater todas as lições de qualquer método usando espaço 1 (um) entre linhas, para economizar papel. No entanto, é bom saber que o espaço 1,5 é o normalmente usado em concurso.
Para bater a tecla do espaço, use sempre o polegar da mão esquerda.
Em Datilografia, a prática é tudo. Portanto, treine com freqüência. Não passe longos períodos sem digitar. Treinando meia hora por dia, de segunda a sexta, é suficiente.
Antes de começar bater o texto, não se esqueça de anotar as horas, para que, ao terminá-lo, saiba exatamente quantos minutos gastou. Anote o tempo gasto no próprio papel em que bateu o texto.
Só comece a bater os textos depois de terminar todas as lições do método que estiver usando. Após terminar de bater o texto a primeira vez, analise detidamente os erros que teve. Bate-o novamente, a fim de eliminar, o máximo possível, esses erros. Passe, então, para outro texto. Não bata o mesmo texto mais de duas vezes seguidas. Ao chegar ao texto de nº 100, volte ao primeiro e proceda da mesma forma como das vezes anteriores.
Se seguir à risca todas as orientações acima, aprenderá a digitar sozinho e será um ótimo datilógrafo. No entanto, caso queira freqüentar uma escola de datilografia, terá que saber escolher uma que realmente ensina. Se chegar a uma escola e verificar que os alunos estão digitando “catando milho” e olhando direto para o teclado, não perca tempo em freqüentá-la, porque irá desaprender e jogar seu precioso dinheiro fora. É fácil aprender a digitar sozinho, desde que tenha força de vontade.
# change ANSI encoding to utf-8
a = open("ansi_file.txt","rb").read() # ansi file
b= unicode(a, "cp1252").encode("utf-8")
f = open("utf-8_file.txt","wb")
f.write(b)
f.close()
# how bypass utf-8 encoded file for be read at python but without latins characters
# this pass the latin characters for the ASCII pattern.
a = open("utf-8_file.txt","rb").read() # utf-8 file
a_string_utf8 = a.decode("utf-8")
from unidecode import unidecode
ascii_a_string = unidecode(a.decode("utf-8"))
f = open("ascii_file.txt","wb")
f.write(ascii_a_string)
f.close()
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment