pvdb/validate_external_urls.sh

## validate_external_urls.sh
#!/usr/bin/env sh

#
# install GNU grep (`/usr/local/bin/ggrep`)...
#
#     brew tap homebrew/dupes; brew install grep
#
# usage - ensure `${PROJECTS_HOME}` is set...
#
#     find ${PROJECTS_HOME}/seedy/content -name '*.md' | ./validate_external_urls.sh > seedy_external_urls.tsv
#

printf '${http_status}\t${external_url}\t${content_file}\n' ;
while read -r content_file ; do
	for external_url in $( ggrep -shoP 'https?://[^)"\] ]+' "${content_file}" ) ; do
		if ruby -r uri -e "URI('${external_url}') rescue exit(1)" ; then
			http_status=$( curl -s -o /dev/null -I -w '%{http_code}' "${external_url}" ) ;
		else
			http_status="666" ; # ad-hoc status code to indicate invalid URL syntax
		fi
		printf '%s\t%s\t%s\n' "${http_status}" "${external_url}" "${content_file}";
	done
done

# That's all Folks!
	#!/usr/bin/env sh

	#
	# install GNU grep (`/usr/local/bin/ggrep`)...
	#
	# brew tap homebrew/dupes; brew install grep
	#
	# usage - ensure `${PROJECTS_HOME}` is set...
	#
	# find ${PROJECTS_HOME}/seedy/content -name '*.md' \| ./validate_external_urls.sh > seedy_external_urls.tsv
	#

	printf '${http_status}\t${external_url}\t${content_file}\n' ;
	while read -r content_file ; do
	for external_url in $( ggrep -shoP 'https?://[^)"\] ]+' "${content_file}" ) ; do
	if ruby -r uri -e "URI('${external_url}') rescue exit(1)" ; then
	http_status=$( curl -s -o /dev/null -I -w '%{http_code}' "${external_url}" ) ;
	else
	http_status="666" ; # ad-hoc status code to indicate invalid URL syntax
	fi
	printf '%s\t%s\t%s\n' "${http_status}" "${external_url}" "${content_file}";
	done
	done

	# That's all Folks!