今回もココナラをWebスクレイピングしていきます。
今回は、ココナラの各出品サービスの出品開始日を求める方法を紹介します。
<集計方法>
まず、ココナラの各出品サービスは「出品の開始日」はどこにも記載してありません。なので出品サービスがココナラ上に掲載された出品開始日を求める方法は大変特殊な方法を取ります。
出品開始日を求める方法として二つの2つの仮定を置きます。
仮定1:出品サービスのURLの番号は古い出品ほど小さい番号になる。
仮定2:出品サービスのページの「評価・感想」の最も古い日付(=最初の販売日)より出品サービスの販売開始日のほうが古い
この2つの仮定より、出品サービスページの「評価・感想」をスクレイピングで取得し、その最も古い日付に近い日付をもとに出品開始日をもとめます。
今回は取得対象の出品のカテゴリを「相談関係」にします。
理由として、最初の購入の相談から納品までの期間が短いため、「評価・相談」の日付と出品開始日ができるだけ近いと予想されるためです。
<集計結果>
集計結果を図1に示します。横軸に出品番号、縦軸に最初の販売日です。
図1:出品番号と最初の販売日の関係
図1を見て分かるように、出品番号が大きいほど、すなわち新しい出品ほど、最初の販売日が新しい傾向がくっきりと分かります。
次に、出品番号前後での一番古い販売日を抽出すると、図2のようになります。
図2:出品番号と最初の販売日の関係(古い販売日抽出)
図2から出品番号から販売開始日の推定がだいぶ明らかになってきました。この関係は出品番号0~200000、200000~800000、800000~で近似できそうなので、この3つの範囲に分けて近似式を計算すると、図3のようになります。
図3:出品番号と最初の販売日の関係(近似式追加)
図3のから、出品番号から販売開始日が用意に計算できます。以下の式が使えます。
・出品番号 ≦ 200000なら
販売開始日 ≒ (0.00332 x 出品番号) + 2015年5月8日
・200000 < 出品番号 ≦ 800000なら
販売開始日 ≒ (0.00136 x 出品番号) + 2016年6月4日
・800000 ≦ 販売開始日なら
販売開始日 ≒ (0.00076 x 出品番号) + 2017年10月17日
あくまで近似計算ですが、これらの計算を用いて今後様々な分析が可能になります。
出品サービスの出品開始が分かることで、その開始日からの販売実績の変化から、古い出品と新しい出品で販売実績の伸びはどのくらい違うのか、結果的に「購入のされやすさ」は昔と今で違うのか?
次回以降でこのような分析をさらに進めていこうと思います。
<前回記事>