Create a gist now

Instantly share code, notes, and snippets.

What would you like to do?
2016/12/30修正バージョン(Windowsでも動作)
#Yahoo! Box Downloader
require 'mechanize'
require 'nokogiri'
require 'kconv'
require 'scanf'
require 'date'
require 'uri'
require 'json'
require 'erb'
require 'net/http'
require 'open-uri'
include ERB::Util
cookie_jar_yaml_path = 'yahoo.yaml' #ログイン情報のクッキーを保存したファイル
filenum_of_page = 100 #一度に読み込むファイル数 20,50,100のどれか
#Yahoo!Boxへアクセス
agent = Mechanize.new
agent.user_agent_alias = 'Windows IE 7'
agent.cookie_jar.load(cookie_jar_yaml_path)
page = agent.get('https://box.yahoo.co.jp/user/viewer')
#Javascriptの文字列からsid,uniqid,crumb,appidを取り出す
tmp_rst = page.search('script')[0]
user_parmsstr = tmp_rst.to_s.split("\n")[2].split(',')
crumb_parameter = tmp_rst.to_s.split("\n")[3].split(',')
appid_parameter = tmp_rst.to_s.split("\n")[4].split(',')
sid = user_parmsstr[0].scanf(" User = {\'sid\':\"%s\"")[0].to_s
topuniqid = user_parmsstr[1].scanf(" \'uniqid\':\"%s\"},")[0].to_s
crumb = crumb_parameter[1].scanf("'bcrumb':\"%s")[0].to_s
appid = appid_parameter[0].scanf("\t\t'appid':\'%s")[0].to_s
puts appid
#scanfうまくいかないのでうしろの"を消す 正規表現ちゃんとかくべき^^;
sid = sid[0,topuniqid.index("\"",2)+1]
topuniqid = topuniqid[0,topuniqid.index("\"",2)]
crumb = crumb[0,crumb.index("\"",2)]
appid = appid[0,appid.index("'",2)]
puts "sid = #{sid}"
puts "uniqid = #{topuniqid}"
puts "crumb = #{crumb}"
puts "appid = #{appid}"
#ここから巡回してファイルをダウンロード
folderList = Array.new
folderList.push(topuniqid)
#folderListが空になるまで巡回する
while folderList.size != 0 do
#folderListから一つ取り出す
nowuniqid = folderList.pop
#そのフォルダ内のファイルのリストが書かれたJSONを取得する
urlstr = "https://box.yahoo.co.jp/api/v1/filelist/" + sid + "/" + nowuniqid + "?_=" + DateTime.now.strftime('%Q').to_s + "&"
urlstr << "results=#{filenum_of_page}&start=1&output=json&sort=%2Bname&filetype=both&meta=1&thumbnail=1&tree=1&sharemembercount=1&ownerinfo=1&boxcrumb="
urlstr << url_encode(crumb)
agent.get(urlstr)
jsonstr = JSON.parse(agent.page.body.to_s)
# 複数ページが存在する場合はまず全ページたどってファイル情報を入手
filenum = jsonstr['ObjectList']['TotalResultsAvailable'].to_s
unless jsonstr['ObjectList']['Object'] == nil
jsonstr['ObjectList']['Object'].each do |object|
type = object['Type'].to_s
name = object['Name'].to_s
uniqid = object['UniqId'].to_s
dlurl = object['Url'].to_s
path = "." + object['Path'].to_s #パスの先頭にドットをつけないとうまく相対パスにならない
#ファイルかフォルダかで処理を分岐
if(type == 'file') then
dlurl << "?appid=#{appid}&error_redirect=1&done=https%3A%2F%2Fbox.yahoo.co.jp%2Ferror%2Fdownload_error&boxcrumb="
dlurl << url_encode(crumb)
#dlurlからリダイレクトされたURLを取得 これがダウンロードリンク
agent.get(dlurl)
redirect_link = agent.page.uri.to_s
#ファイルを保存
#File.write(path, Net::HTTP.get(URI.parse(redirect_link)))
open(redirect_link) do |file|
open(path, "w+b") do |out|
out.write(file.read)
end
end
puts "Download #{path}"
elsif(type == 'dir') then
#folderListに追加してあとで巡回
folderList.push(uniqid)
Dir.mkdir(path)
end
end
end
end
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment