| プロフィール | 私書箱 受/送/送済 | 評価履歴 共感[受/送] | DB作成履歴 生成/承認/受 | 書き物 [書く] | リンク集 登録有 |
| RSSリーダー登録 |
|---|
| RSS |
| 日記表示スタイル |
| ホームページ型/携帯 画像/動画/音声/リンク |
| 表示開始年月 |
| 日記内検索 |
| 分類 |
| 全て 1.このサイトについて 2.作品DB開発/運用 3.ホームページ制作技術 4.Perl 5.C++ 6.検索エンジンレポート 7.サッカー 8.自分のこと 9.Linux 10.旅行 11.思ったこと 12.Berkeley DB 13.その他技術系 14.企画 15.スマートフォン 16.自分限定メモ 17.運用マニュアル(自分用) 18.技術系以外実用書 19.料理 20.ALEXA 21.アニメ 22.会計 23.プログラミング全般 24.設計書 |
| 挨拶 ここは accessup.org の管理人さん のページです。 サイトに関する お問い合わせは こちからから 日記の内容 日記では主に ・サイト運営/開発 ・検索エンジン情報 ・技術ネタ(Berkeley DB, Linux, Perl, サイト作成等) を扱っています。 お気に入りPV Blackmore's nightの Magical world (ロミオとジュリエットの歌) サイト内管理系ショートカット 1.定期更新処理 2.英語版Myページ 3.未処理削除提案 4.承認待ち提案 5.日々のタスクチェック 思い付きメモ [サイト作成での心構え] ・孤独死させない ・リアルタイムに変化させる 気に入った言葉集 [ビジョン] 無いものに 気付くことができる [対人] 士は己を知る者 のために死す [仕事] 日々1%の改善は 年37倍の改善 2人の日々1%の改善は 37x37=年1427倍の改善 組織の改善は大きい Noと言わなければ 優先順位は決定できない Noの言い方には色々ある ・優先順位 ・時間ができたら ・他人に依頼 ・次期にやる ・絶対駄目 [ビジネス] 必ず1位を取れるところで勝負 2位はつまりは敗北 [組織] 人が好きな人が必要 PMは方法論より チームに注力すべき 自己決定的であることが重要 [経営] 戦略は道標だから 敵や状況で変わらないもの にする(右往左往しない) 変えるのは戦略ではなく戦術 経営者は他は劣っても 熱意・情熱だけは最高 でなければならない [生活] 家族は自分が守るべき 最小の単位 良い習慣を身に付ける鍵は 何度も実践すること 現代の生活は時間の浪費 に満ちている [人生] 日々の生活の中で 目標を見失わないこと 補足 この日記の左メニューは Myページの 自分のページをカスタマイズ から設定可能 |
1. 文章目的
2. 大量スパムメール送信業者の、最初のメールアドレスの集め方
3. クローラー対策
4. HTMLページの場合
5. CGI (Perl)の場合
6. プログラム言語が使えない環境の場合(i-mode用ページとか)
世の中にはスパム(宣伝)メールが溢れていて、本来の目的のメール数よりもスパムメールが多いという。 ホームページにメールアドレスを書くということは、スパムメールを呼び込む入口になる。どこにもそういうことについて対策・警告を書いているホームページがないので、世の中に考え方と対策を広めるために、情報を公開する。特に、掲示板などで参加者のメールアドレスを書き込む場を与えているホームページ管理者は、そのメールアドレス対策について責任を持たなければならない。
クローラー
対策における基本となるコンセプトは、テキストのパターンマッチングでemailアドレスを収集するのだから、そのパターンを満たさないようにemailアドレスを書くことになります。
javascriptを使ってemailアドレスを書きましょう。javascriptで書けば、そこはjavascriptプログラムを解釈できるものでなければ読めないことになります。例えば、email@email_12345.comというアドレスをホームページに書く時には、
CGIを実行した時の結果は、HTMLで出るので、結局のところ、HTMLの場合と同じ事をすることになります。ただ、それをプログラムによって書き出すというだけです。ここでは、CGI用の言語としてよく使われ、文字列操作に優れるPerlを例に挙げます。 <=悪用しないこと。この機能を使ったからといってルールの適用基準が変わることはありません。
「クローラー」とは、ウェブサイトの内容を収集していくプログラムのことで、所謂ロボット型サーチエンジンのスパイダーに当たる。ウェブサーチの場合には、ページの内容を収集して検索対象にするのだが、スパムメール業者使うクローラーは、そのホームページ内に書かれているemailアドレスを収集して、スパムメール送信宛てリストを生成する。 具体的には、...と書かれている内の、email@email_12345.comの部分をパターンマッチングで引き出す。また、それはタグで書かれているものとは限らず(それは収集対象としては確実でしょうが)、
[英数字記号1文字以上]@[英数字記号1文字以上].(ドット)[英数字記号1文字以上と.(ドット)の組合せ][英字で終わる]
のパターンで集めることもできます。
また、ここで集められたメールアドレスは、スパムメール業者が他の人に販売したりして広まってしまい、メールの内容にこのメールを止めたければ...、というのに応じても、他のところからスパムメールが届き続けるということになります。
つまり、ホームページにメールアドレスを書くだけで、スパムメールにそのメールアドレスは汚染されてしまうのです。
また、ホームページを持っている方は、掲示板を大概持っているかと思いますが、掲示板には、大概オプションで書き込み者のメールアドレスを書く欄があるので、それをきっかけに書き込み者のメールアドレスにスパムメールが届くことになってしまいます。
3. クローラー対策
4. HTMLページの場合
結果
email@email_12345.com
という風に書きます。このように分割し、しかもjavascript部に書かれると、クローラーもその文章からemailアドレスを引き出すことはできません。
5. CGI (Perl)の場合
例えばですが、$emailという変数にメールアドレスが入っている場合、
my ($email_head,$email_tail)=split('@',$email); # @でメールアドレスを分割
print "文字(隠し系はネタバレ防止用/非難の隠しに使わない事): 隠し 下線 下付 斜 取消線 小 上付 太 大 注意付隠し
色: ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■
レイアウト: タグ制限解除 囲み 横棒 中央 / その他特殊機能
コピペ(タグ参考)欄
お名前(階位必要):
パスワード: