Groovy + Geb + Selenium による、電子書籍試し読みサイト の画像を保存するスクリプトです。解説はこちら:
import geb.Browser {
go args[0] // URL
// get number of pages
def pages = Integer.parseInt($('div#page_indicator')?.text().split(' ')[2])
// get encoded iamges in data URI
def list = []
(0..(pages-1)).each { page ->
list << $('div.page_pnl', 'data-page-prefix': "${page % 2 * 2}")?.children()[0].@src
list << $('div.page_pnl', 'data-page-prefix': "${page % 2 * 2 + 1}")?.children()[0].@src
// decode data & save iamges
list.eachWithIndex { url, index ->
if(url.startsWith('data:') && url.split(',').size() == 2) {
def encodedImage = url.split(',')[1]
new File("page-${index}.jpg").bytes = Base64.getDecoder().decode(encodedImage)
