pmlandwehr/cf_cloud_stats.py

## cf_cloud_stats.py
from bs4 import BeautifulSoup
import numpy as np
import pandas
import requests
from tqdm import tqdm

TOTAL_CF_REPO_PAGES = 45

package_tags = list(chain.from_iterable([
    BeautifulSoup(requests.get('https://anaconda.org/conda-forge/repo',
                               params={'page': x}).text,
                  'lxml').find_all('span', class_='packageName')
    for x in tqdm(range(1, TOTAL_CF_REPO_PAGES))
]))

package_names = [x.contents[0] for x in package_tags]

dl_counts = []
for pkg in tqdm(package_names):
    r = requests.get('https://api.anaconda.org/package/conda-forge/{}'.format(pkg))
    try:
        dl_counts.append(np.sum(x['ndownloads'] for x in r.json()['files']))
    except:
        dl_counts.append(np.nan)

df = pd.DataFrame({'pkg': package_names, 'dl_count': dl_counts})

df.sort_values('dl_count', ascending=False).head(50)
	from bs4 import BeautifulSoup
	import numpy as np
	import pandas
	import requests
	from tqdm import tqdm

	TOTAL_CF_REPO_PAGES = 45

	package_tags = list(chain.from_iterable([
	BeautifulSoup(requests.get('https://anaconda.org/conda-forge/repo',
	params={'page': x}).text,
	'lxml').find_all('span', class_='packageName')
	for x in tqdm(range(1, TOTAL_CF_REPO_PAGES))
	]))

	package_names = [x.contents[0] for x in package_tags]

	dl_counts = []
	for pkg in tqdm(package_names):
	r = requests.get('https://api.anaconda.org/package/conda-forge/{}'.format(pkg))
	try:
	dl_counts.append(np.sum(x['ndownloads'] for x in r.json()['files']))
	except:
	dl_counts.append(np.nan)

	df = pd.DataFrame({'pkg': package_names, 'dl_count': dl_counts})

	df.sort_values('dl_count', ascending=False).head(50)