kguidonimartins/scraplinks.R

## scraplinks.R
if (!require("tidyverse")) install.packages("tidyverse")
if (!require("rvest")) install.packages("rvest")
#' Extract link texts and urls from a web page
#' @param url character an url
#' @return a data frame of link text and urls
#' @examples
#' \dontrun{
#' scraplinks("http://localhost/")
#' glinks <- scraplinks("http://google.com/")
#' }
#' @export
scraplinks <- function(url){
    # Create an html document from the url
    webpage <- xml2::read_html(url)
    # Extract the URLs
    url_ <- webpage %>%
        rvest::html_nodes("a") %>%
        rvest::html_attr("href")
    # Extract the link text
    link_ <- webpage %>%
        rvest::html_nodes("a") %>%
        rvest::html_text()
    return(tibble(link = link_, url = url_))
}
	if (!require("tidyverse")) install.packages("tidyverse")
	if (!require("rvest")) install.packages("rvest")
	#' Extract link texts and urls from a web page
	#' @param url character an url
	#' @return a data frame of link text and urls
	#' @examples
	#' \dontrun{
	#' scraplinks("http://localhost/")
	#' glinks <- scraplinks("http://google.com/")
	#' }
	#' @export
	scraplinks <- function(url){
	# Create an html document from the url
	webpage <- xml2::read_html(url)
	# Extract the URLs
	url_ <- webpage %>%
	rvest::html_nodes("a") %>%
	rvest::html_attr("href")
	# Extract the link text
	link_ <- webpage %>%
	rvest::html_nodes("a") %>%
	rvest::html_text()
	return(tibble(link = link_, url = url_))
	}