pornpare.comの開発日記

www.pornpare.comの開発日記です。

振り出しに戻った1週間

今週1週間は色々とありました。

 

* ec2インスタンスのサイズが小さくなった

* PVが減った

* 広告を導入した

* クローラサーバーの刷新を決めた

 

どれもこれも先週の記事

pornpare.hatenablog.com

に付随する内容ではあります。

 

* ec2インスタンスのサイズが小さくなった

さすがにサーバー負荷増加のペースが早すぎるだろうということで、

その後NewRelicを導入して負荷解析を進めた結果、

動画詳細ページでredis cacheをしている部分が負荷の原因だと判明しました。

ここを修正した結果インスタンスサイズを小さく低コスト化をすることができました。

before/afterはこんなかんじ、もっと早く導入していればよかったですね。

f:id:pornpare:20171011014105p:plain

 

* PVが減った

Pornpare.comに掲載させていただいているサイトさんはチャネルとしてインバウンド/アウトバウンド両方とも存在します。

で、ユーザビリティ低いサイトを掲載するのは私のポリシーに反するということで、掲載前にある程度サイトを見た上で判断を行っているのですが、いくつかのサイトを掲載後のタイミングで掲載を停止する判断を行いました。

対応内容としては今後記事を掲載しないというのはもちろんなのですが、過去掲載した記事についても全削除を行いました。

結果として2000/50000程度の記事を削除したため、流入経路となっていた記事が幾つか消滅しPV減少に繋がったかたちとなります。

f:id:pornpare:20171015194410p:plain

数字的にはおもったよりもダメージが大きかったのですがまぁ仕方なしかなと思っています。

 

* 広告を導入した

クリック保証型の広告の導入を行いました。

前回の記事の話に付随しますが、改めてサービスを安定的に提供するためにはマネタイズもセットで考えなければならないなと思ったためです。

広告という制約がある中で、いかにユーザビリティを上げるかが重要だなと今は考えています。

 

* クローラサーバーの刷新を決めた

こちらは最優先で進めたい開発に関わるものです。

技術的な話はほどほどにしますが、

pornpareの記事クローリングにはphantomjsというヘッドレスブラウザを使っています、刷新内容としてはこのphantomjsでのクローリングからgoogle提供のHeadless Chromeによるクローリングへの変更が主になります。

あわせてphantomjsをrailsで動かしていましたが、headless chromeを操作するAPIpythonかnodejsのものしか現状有力なものがなさそうでしたの下記のもので実装を進めます。

github.com

 

理由としてはこのphantomjsが今後積極的な開発が行われないと決定したことにあわせて、html5実装であるvideo周りの操作にも対応をしていないというのが決め手になりました。

 

そんな感じでサービス拡大にあわせて、

今まで手をつけようにもつけられなかった問題に着手しようと決定したのが今週のハイライトになります。

 

以上今月もよろしくお願いします

(クローラ周りの回収は劇的にユーザビリティ上がるはずなので今月で実装終えたいところです)