iwatedon.net は、数々の独立したMastodonサーバーのうちのひとつです。サーバーに登録してFediverseのコミュニティに加わってみませんか。
岩手県出身の管理人が運用しているマストドンサーバー「イワテドン」です。 通称「Fediverseの岩手県」と呼ばれる、きわめて平和なサーバーです。 岩手県の地域マストドンサーバーのような気分ですが、現在は実質的な汎用鯖となっています。 特に話題の制限とかはないので、常識的な範囲で自由に使っていただければと思いますm(__)m

サーバーの情報

15
人のアクティブユーザー

あくあーら@イワテドン鯖缶

アクセスする度に内容が変わるページを、Headless Firefoxでスクレイピング(具体的には部分&全体のスクリーンショットの取得)しようとしているのだが、

- 画面全体のスクリーンショットはコマンドラインからしか取れない(Selenium経由だとどうしても画面全体が取れない)
- DOMのスクリーンショットは(おそらく)Selenium経由でしか取れない

アクセスする度に内容が変わるページが対象なので、HTTPアクセス1回で全データを取る必要があるのに、画面全体&特定DOMのスクリーンショットを同時に取得する手法が存在しなくて、地味に詰んでいる感がある。PhantomJSから乗り換えられない・・・

画面全体が取れないなら、画面一部を取ってスクロールしながら画像結合すれば・・・とも考えたけど、アクセスするたびに内容が変わるんだから、複数回アクセスしてる時点で画像は結合できない・・・

なおHeadless Chromeの場合、一発で画面全体のスクリーンショットを取る方法がそもそも存在しない(と思われる)ので、選択肢から外れております・・・

@aquarla 俳句を発見致しました!
『内容が変わるページが対象な』