:::color:red 2016年5月28日追記:現在は稼働してません。 :::

このサイトのSEO用にHTMLをプリレンダーするサーバーのPhantomJSのメモリ消費が大きくて気になったのでherokuの方に構築してみた。

$ curl http://seo-endaaman-me.herokuapp.com/http://endaaman.me/memo

$ curl http://endaaman.me/memo

でAjax取得できれたデータがHTML上に反映されているのが分かると思う。単純にパス以降のURLをPhantomJSで開いてHTMLをレンダリングしてるだけだけど。前に作ったspaseo.jsはハンドラーだけの提供を目指した結果見事なまでのコールバック地獄に陥ったので、その反省を活かしていつものkoaにしたらかなりスッキリかけた。あとでhostに/^endaaman\.me$/でホワイトリストかけてるので、関係ないサイトはレンダーできないです。forkして自分でherokuに乗っけてください。

リポジトリ: endaaman/seo-endaaman-me

あとはnginxだったらconfにUserAgentとか_escaped_fragment_をチェックした中に

   location / {
        index  /index.html;
        try_files $uri @fallback;
        expires off;
    }

    location @fallback {
        set $prerender 0;
        if ($http_user_agent ~* "googlebot|twitter|facebook|yahoo!|bingbot|msnbot|y!j|hatena|ssk|naverbot") {
            set $prerender 1;
        }
        if ($args ~ "_escaped_fragment_") {
            set $prerender 1;
        }
        if ($uri ~ "\.(js|css|xml|less|png|jpg|jpeg|gif|pdf|doc|txt|ico|rss|zip|mp3|rar|exe|wmv|doc|avi|ppt|mpg|mpeg|tif|wav|mov|psd|ai|xls|mp4|m4a|swf|dat|dmg|iso|flv|m4v|torrent|ttf|woff)") {
            set $prerender 0;
        }

        resolver 8.8.8.8;

        set $protocol 'http://';
        if ($https) {
            set $protocol 'https://';
        }

        # これはデバッグ用
        set $prerender_host '127.0.0.1:3001';
        if ($host = 'endaaman.me') {
            set $prerender_host 'seo-endaaman-me.herokuapp.com';
        }

        if ($prerender = 1) {
            rewrite .* /$protocol$host$request_uri? break;
            proxy_pass http://$prerender_host;
        }
        if ($prerender = 0) {
            rewrite .* /index.html break;
        }
    }

みたいに http://target_host/path/to/contentGET http://seo-endaaman-me.herokuapp.com/http://target_host/path/to/content って感じ書き換えるようにすれば、Googleさんが相手してくれるようになるはず。

今更になって初めてheroku使ったけど悪いことたくさんできそうで楽しいね。