set your own apikey in credentials.py.
google_apikey = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
then test it.
$ python google_translation_api.py
['こんにちは', '東京']
日本でもスクレイピングの注意点を指摘する記事は多数ありますが、具体的な事例、方針は
程度なので海外の事例はないのか?と調べたらやっぱりありました。スクレイピングをブロックするサービスを提供する会社distil networksの記事 "Is Web Scraping Illegal? Depends on What the Meaning of the Word Is Is."を事件一覧として、各事件をググって詳細を調べました。箇条書き形式で参考文献もそのまま付け足しています。
Information wants to be free |
import itertools | |
from requests import get | |
pagelist_get = get | |
from lxml.html import fromstring | |
from traceback import print_exc | |
from umihico_commons.functools import map_multithreading, flatten, save_as_txt | |
from umihico_commons.proxy import ProxyRequests | |
from umihico_commons.chrome_wrapper import Chrome, Keys | |
from time import sleep | |
from tqdm import tqdm |