Skip to content

無料スクレイパー、または信頼性が高くスケーラブルなデータ収集に対応する Bright Data の高ボリューム Google Flights Scraper API を使用して、Google Flights からリアルタイムのフライトデータを取得します。

Notifications You must be signed in to change notification settings

bright-jp/google-flights-api

Repository files navigation

Google Flights スクレイパー

Promo

このリポジトリでは、Google Flights からフライトデータを抽出するための2つの方法を提供します。

  1. 無料 Google Flights スクレイパー: 小規模な抽出に最適です
  2. Google Flights スクレイパー API: 大量かつリアルタイムのデータ抽出向けに設計されており、リクエスト数は無制限です。Bright Data の SERP Scraping API の一部です。

Table of Contents

  1. 無料スクレイパー
  2. Google Flights スクレイパー API
  3. 追加パラメータ
  4. サポート&リソース

無料スクレイパー

Google Flights から限られたデータを抽出するための、手早くシンプルなスクレイパーです。

google-flights-scraper

セットアップ要件

pip install playwright
playwright install chromium

Webスクレイピングは初めてですか? こちらの Python で学ぶ Webスクレイピング入門ガイド をご覧ください

クイックスタート

  1. google-flights-scraper.py を開きます
  2. 次の変数を更新します:
    • url: Google Flights のURLを貼り付けます(通常 tfs を含みます)。
  3. スクリプトを実行します。

💡 Pro Tip: Google のアンチスクレイピング対策による検知を最小化するために、HEADLESS = False に設定してください。

サンプル出力

{
  "airline": "Emirates",
  "departure_time": "4:15 AM",
  "arrival_time": "2:00 PM",
  "duration": "22 hr 15 min",
  "stops": "1 stop in DXB",
  "price": "$1,139",
  "co2_emissions": "1,092 kg CO2e",
  "emissions_variation": "+6% emissions"
}

👉 完全な出力サンプルを見る

制限事項

無料スクレイパーにはいくつかの制約があります:

  • IPアドレスがブロックされるリスクが高いです
  • リクエスト量が制限されます
  • CAPTCHA が頻繁に発生します
  • 本番利用には信頼性が不十分です

これらの制限なしで堅牢かつスケーラブルなスクレイピングを行うには、以下の Bright Data 専用APIをご検討ください。👇

Google Flights スクレイパー API

Bright Data の Google Flights スクレイパー APISERP Scraping API に統合されており、当社の広範な プロキシネットワーク を活用して、価格、スケジュール、航空会社の詳細などのリアルタイムなフライトデータを、CAPTCHA や IP ブロックなしで大規模に抽出します。

主な機能

  • グローバルな正確性: 特定の場所に合わせた結果を提供します
  • Pay-Per-Success: 成功したリクエストに対してのみ支払います
  • リアルタイムデータ: 最新のフライトデータを数秒で取得します
  • 無制限のスケーラビリティ: 大量のスクレイピングを容易に処理します
  • コスト効率: 高価なインフラが不要になります
  • 信頼性の高いパフォーマンス: ブロック回避技術を内蔵しています
  • 24/7 専門サポート: 必要なときにいつでも支援を受けられます

前提条件

  1. Bright Data アカウントを作成 します(新規ユーザーには $5 のクレジットが付与されます)。
  2. API key を生成します。
  3. ステップバイステップガイド に従って SERP API を設定し、認証情報をセットアップします。

Direct API アクセス

API エンドポイントへ直接リクエストします。

cURL 例:

curl https://api.brightdata.com/request \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer API_TOKEN" \
  -d '{
        "zone": "ZONE_NAME",
        "url": "https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDREVMcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg",
        "format": "raw"
      }'

Python 例:

import requests

url = "https://api.brightdata.com/request"
headers = {"Content-Type": "application/json", "Authorization": "Bearer API_TOKEN"}
payload = {
    "zone": "ZONE_NAME",
    "url": "https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDREVMcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg",
    "format": "raw",
}

response = requests.post(url, headers=headers, json=payload)

with open("google-flights-data.html", "w", encoding="utf-8") as file:
    file.write(response.text)
print("HTML response saved to 'google-flights-data.html'.")

ネイティブのプロキシベースのアクセス

代わりに、Bright Data のプロキシルーティング方式を使用します。

cURL 例:

curl -i \
  --proxy brd.superproxy.io:33335 \
  --proxy-user "brd-customer-<customer-id>-zone-<zone-name>:<zone-password>" \
  -k \
  "https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDREVMcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg"

Python 例:

import requests
import urllib3

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

host = "brd.superproxy.io"
port = 33335
username = "brd-customer-<customer-id>-zone-<zone-name>"
password = "<zone-password>"
proxy_url = f"http://{username}:{password}@{host}:{port}"

proxies = {"http": proxy_url, "https": proxy_url}
url = "https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDREVMcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg"
response = requests.get(url, proxies=proxies, verify=False)

with open("google-flights-data.html", "w", encoding="utf-8") as file:
    file.write(response.text)

print("Response saved to 'google-flights-data.html'.")

👉 完全な HTML 出力 をご覧ください。

注: 本番利用では、SSL Certificate Guide に従って Bright Data の SSL 証明書を読み込んでください。

追加パラメータ

これらのオプションパラメータを使って、Google Flights のデータ抽出を微調整できます。

ローカライゼーションパラメータ

bright-data-google-flights-api-localization

場所と言語に基づいて検索結果をカスタマイズします:

Parameter Description Example
gl 2文字の国コード gl=us (United States)
hl 2文字の言語コード hl=en (English)

例: パリからロンドンへのフライトをフランス語で検索します:

curl --proxy brd.superproxy.io:33335 --proxy-user brd-customer-<customer-id>-zone-<zone-name>:<zone-password> \
"https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDQ0RHcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg&hl=fr&gl=fr"

通貨パラメータ

bright-data-google-flights-api-currency

curr パラメータを使用して、返される価格の通貨を定義します。

例: 価格を USD で返します。

curl --proxy brd.superproxy.io:33335 --proxy-user brd-customer-<customer-id>-zone-<zone-name>:<zone-password> \
"https://www.google.com/travel/flights/search?tfs=CBwQAhojEgoyMDI1LTA0LTAxagcIARIDQ0RHcgwIAxIIL20vMDRqcGxAAUgBcAGCAQsI____________AZgBAg&hl=fr&gl=fr&curr=USD"

サポート&リソース

About

無料スクレイパー、または信頼性が高くスケーラブルなデータ収集に対応する Bright Data の高ボリューム Google Flights Scraper API を使用して、Google Flights からリアルタイムのフライトデータを取得します。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages