Last active
July 2, 2020 00:18
-
-
Save jkcgs/ec17538538ea7b56405cde70ed5bcf71 to your computer and use it in GitHub Desktop.
find_str, una función bastante útil para hacer scrapping sin tener que usar bs4.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
def find_str(cont, ini, end): | |
""" | |
Busca una cadena de texto según una cadena inicial y otra final. Extrae el texto que está | |
inmediatamente después de la cadena inicial, para buscar la cadena final desde la inicial, | |
y devuelve el texto que está entre ellos, sin incluir las cadenas de búsqueda. | |
Ejemplo: | |
Si cont = `Hola, ¿cómo están todos?, ¿qué tal el día?`, ini = `¿`, end = `?`, el resultado | |
será `cómo están todos`. | |
:param cont: El contenido donde se buscará. | |
:param ini: La cadena de texto inicial. | |
:param end: La cadena de texto final. | |
:return: El resultado, o None si no se encontró. | |
""" | |
try: | |
idx_ini = cont.index(ini) + len(ini) | |
idx_end = cont[idx_ini:].index(end) + idx_ini | |
return cont[idx_ini:idx_end] | |
except ValueError: | |
return None |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment