X/Twitter ユーザーID取得処理に関するTIPs

記事
IT・テクノロジー
XのユーザIDをPythonで取得する業務を実施しました。依頼者が納品差し戻しし、結局キャンセルとなったためこちらでアウトプットしようと思います。
(同時期にInstagramについても同様の業務実施しました。)
サービスとして出品しています↓
取得結果
結果から書きます。 実際の取得結果です ↓
img_20240518_1.png

ランキング上位50件の人気検索ワード(ただしInstagram、※すべて英語)で検索し、検索結果である多数の投稿から辿ってユーザ情報を取得
・プロフィールはじめとするユーザー情報に平仮名ないしカタカナが含まれ
・フォロワ数が5000以上10万以下
に該当するユーザを抽出したものが上の17件です。
仮に日本語タグで検索していればこの 5~10倍くらいの結果になるのではないか。

取得条件など

■条件
・インスタ(Xではなく)のランキングのタグ上位50件について
・タグから、投稿経由で、ユーザー取得
・50件のうち2件は中断があったため集計から除外
■所要時間
全体の処理時間が3.5時間
ただし、10分ていどアクセスを続けると通信が遮られて
回復するまで10~20分待つ必要があるようで
実際の所要時間は
 7~10時間ていどと予想される。
■取得結果(重複カウントはしてない)
総3846ユーザ
  そのうち
  ・フォロワ数5千~100000:767
  ・日本語判定されたユーザ:152
  ・日本語判定かつフォロワ数5千~100000:17

Pythonコード(有償記事へのリンク)

有償公開してみます。
詳細はお問い合わせください。
同種業務のご発注についてもできるだけ対応する考えです。


サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す