サイトまたはプラットフォームでのユーザー生成スパムを防止する

スパマーは、公開コメント フォームやその他のユーザー作成コンテンツの入力情報を利用して、無防備なユーザーのサイトでスパム コンテンツを生成することがよくあります。ホスティング プラットフォームでも同様に不正行為が起きる可能性があります。スパマーによって、Google のスパムに関するポリシーに違反し、ウェブにほとんどまたはまったく価値をもたらさないサイトが多数作成されることもあります。

通常、プラットフォームやサイトでの不正行為の防止は困難ではありません。単純な抑止策(例: プロパティを操作する前に完了しなければならない通常は存在しない課題)によっても、スパマーはスパム行為を断念する可能性があります。

サービスを利用したスパム行為を許さないことをユーザーに伝える

明確な不正使用ポリシーを公開するとともに、(新規登録時などに)ユーザーに伝えます。さらに、信頼できるユーザーがプロパティに関してスパムとみなしたコンテンツを報告できるようにします。

スパム行為のあるアカウントを特定する

登録などのプラットフォームに対するユーザーの操作の記録を保存して、次のようなスパムの典型的なパターンを特定します。

  • フォームの入力にかかった時間
  • 同じ IP アドレス範囲から送信されたリクエストの数
  • 登録時に使用されたユーザー エージェント
  • 登録時に選択された、ユーザー名などのフォームから送信される値

これらのシグナルは、ユーザー評価システムを作成する際に活用できます。このシステムを使用することで、ユーザーの参加を促進するだけではなく、スパマーを特定することもできます。多くの場合、スパムコメントの投稿者の目的は、検索エンジンに自分のコンテンツを登録することです。そのため、プラットフォームで未評価の新しいユーザーからの投稿には noindex robots meta タグを追加することをおすすめします。その後、ユーザーが適正と評価された時点で、そのユーザーのコンテンツのインデックス登録を許可します。これは、スパマーによるプラットフォームの操作を阻止する上で非常に役立ちます。

多くの場合、スパマーにとってはサイトへのリンクを残すことが動機付けとなるため、信頼できないコンテンツ内のすべてのリンクに nofollow または ugc rel 属性を追加することを検討してください。

不審なユーザー操作に対して手動による承認を使用する

特定のユーザー操作に対する手動による承認(モデレーション)によって、スパマーがスパムの可能性があるコンテンツを即座に作成しないようにすることで、プラットフォーム上のスパムを大幅に削減できます。モデレーションによって日常的なワークフローのオーバーヘッドは増加しますが、モデレーションはスパム対策の非常に効果的な方法です。たとえば、ほとんどの CMS にはコメント管理機能が組み込まれていることからも、モデレーションによる効果が認められます。

ブロックリストを使用してスパム行為の繰り返しを防ぐ

ブラックリストを使用すれば、スパム行為のあるプロフィールが 1 件見つかったときに他のスパム行為のあるプロフィールもすべて簡単に削除できます。たとえば、同じ IP アドレスからスパム行為のあるプロフィールがいくつか作成されている場合は、その IP アドレスを恒久的に参加禁止リストに追加できます。CMS(WordPress など)に対しては、Akismet などのプラグインが有効ですが、ファイアウォールの拒否リストに IP アドレスを追加するのも非常に効果的です。

自動アカウント作成をブロックする

登録フォームで reCAPTCHA またはその他の確認ツールを使用することを検討します。それによって人間による送信のみを許可し、自動化スクリプトを使用してホスティング サービスで大量のサイトを生成する行為を防止できます。

サービスの不正使用をモニタリングする

  • プロパティにスパムの兆候がないかをモニタリングします。そうした兆候には、リダイレクト、大量の広告セクション、スパム行為のための特定のキーワード、エンコードされた JavaScript コードの大規模なセクションなどがあります。「site:」形式の検索演算子や Google アラートは、問題の検出に役立ちます。
  • ウェブサーバーのログファイルで、突発的なトラフィックの増加がないかを調べます。
  • フィッシングやマルウェアに感染しているページが存在しないかプロパティをモニタリングします。たとえば、Google Safe Browsing API を使用してサービスの URL を定期的にテストできます。
  • 信頼性をチェックする方法を考案します。たとえば、主に日本のユーザーをターゲットにしている場合、プロパティで夜間にイタリアの IP からのユーザー インタラクションが数千も発生する可能性はどれくらいでしょう。新たに作成されたサイトの言語を検出するには、言語検出ライブラリGoogle Translate API v2 など、さまざまなツールを使用できます。