Skip to content

Instantly share code, notes, and snippets.

@jkcgs
Last active July 2, 2020 00:18
Show Gist options
  • Save jkcgs/ec17538538ea7b56405cde70ed5bcf71 to your computer and use it in GitHub Desktop.
Save jkcgs/ec17538538ea7b56405cde70ed5bcf71 to your computer and use it in GitHub Desktop.
find_str, una función bastante útil para hacer scrapping sin tener que usar bs4.
def find_str(cont, ini, end):
"""
Busca una cadena de texto según una cadena inicial y otra final. Extrae el texto que está
inmediatamente después de la cadena inicial, para buscar la cadena final desde la inicial,
y devuelve el texto que está entre ellos, sin incluir las cadenas de búsqueda.
Ejemplo:
Si cont = `Hola, ¿cómo están todos?, ¿qué tal el día?`, ini = `¿`, end = `?`, el resultado
será `cómo están todos`.
:param cont: El contenido donde se buscará.
:param ini: La cadena de texto inicial.
:param end: La cadena de texto final.
:return: El resultado, o None si no se encontró.
"""
try:
idx_ini = cont.index(ini) + len(ini)
idx_end = cont[idx_ini:].index(end) + idx_ini
return cont[idx_ini:idx_end]
except ValueError:
return None
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment