机票是销售点定价最纯粹的例子:同一个座位的价格会因你从哪里发问而不同。下面讲清如何采集完整的价格矩阵。
航班机票是按销售点定价的——它们因国家、币种与设备而异——而元搜索站(Google Flights、Skyscanner)通过异步 JavaScript 定价调用加载它们。用真实浏览器在每个销售点国家的住宅/移动 IP 上采集,设置匹配的币种/区域,让结果稳定下来,并跨市场采样相同航线以构建完整矩阵。请先查看条款与我们的 法律概览。
会。航空公司与聚合站按销售点国家、币种、有时还有设备来分段机票,所以同一航班对印度购票者与对德国购票者可能显示不同价格。要采集某个市场中真实顾客所付的机票价格,就要从该国家的 IP 发起查询——销售点本身就是价格的一部分。
两者都是大量使用 JavaScript 的元搜索前端,在页面加载后发起实时定价请求,然后异步更新结果。静态 HTML 抓取会错过真实机票。你需要一个能运行页面的浏览器(或对底层定价调用的谨慎重放),并有足够的耐心等结果稳定下来再读取。
通过位于你关注的销售点国家的住宅或移动 IP 驱动真实浏览器,设置匹配的币种/区域,并控制查询节奏使其看起来像人。从多个国家采样相同航线,以捕获完整的价格矩阵。数据中心 IP 既会扭曲销售点,又会很快被封。