/rss_image.py

## rss_image.py
#!/usr/bin/env python
import feedparser
import requests
from bs4 import BeautifulSoup
from subprocess import call

def get_urls(urlgot):
	response = requests.get(urlgot)
	# parse html
	page = str(BeautifulSoup(response.content,'lxml'))
	def getURL(page):
	    start_link = page.find("a href")
	    if start_link == -1:
	        return None, 0
	    start_quote = page.find('"', start_link)
	    end_quote = page.find('"', start_quote + 1)
	    url = page[start_quote + 1: end_quote]
	    return url, end_quote

	while True:
	    url, n = getURL(page)
	    page = page[n:]
	    if url:
	    	call(["image-scraper", url])
	    	print(url)
	    else:
	        break


urls = []

for urlx in urls:
	url = feedparser.parse(urlx)
	mm = 0
	for x in url.entries:
		print("current entry is" + str(mm))
		mm=mm+1
		print(str(x.link))
		get_urls(str(x.link))
	#!/usr/bin/env python
	import feedparser
	import requests
	from bs4 import BeautifulSoup
	from subprocess import call

	def get_urls(urlgot):
	response = requests.get(urlgot)
	# parse html
	page = str(BeautifulSoup(response.content,'lxml'))
	def getURL(page):
	start_link = page.find("a href")
	if start_link == -1:
	return None, 0
	start_quote = page.find('"', start_link)
	end_quote = page.find('"', start_quote + 1)
	url = page[start_quote + 1: end_quote]
	return url, end_quote

	while True:
	url, n = getURL(page)
	page = page[n:]
	if url:
	call(["image-scraper", url])
	print(url)
	else:
	break



	urls = []

	for urlx in urls:
	url = feedparser.parse(urlx)
	mm = 0
	for x in url.entries:
	print("current entry is" + str(mm))
	mm=mm+1
	print(str(x.link))
	get_urls(str(x.link))