energy note

色々と勉強中なので備忘録として。

迷惑メールを集計してみるか①

嫌でも送られてきてしまうやつ。そう迷惑メール。SPAM
本当にうざいんですよね。
数年前とか、携帯のキャリアメールに数十分に1通くらいのペースで来てて本気で何かしら仕返しできないのか!?ってなるくらい怒って沸騰していた時期がありました。
その辺の時に仕返し方法探していた時に見つけたのはこれ。
antideai.syoyu.net
さすがにここまではリスク高すぎてできないw
逆に大量にメールを送り付けるとかは、それはそれで法的にアウト?だと。(いやいやそもそも迷惑メールの時点で)
www.dekyo.or.jp
そもそも、承諾もしていないのに送り付けてきている時点であれですが、表示義務もアウトだし企業のロゴとか使ってたらそれもそれでアウトじゃん。
www.dekyo.or.jp
もっと処分されている業者いると思った・・・でもちょいちょい迷惑メール?フィッシング?的なので摘発されているニュース見るから載っていないのとかあるのかな。
本当に心の底からどうにかしてほしい、と思いますね。明らかにアウトなの多そうだからもっと取り締まれないもんですかね。実害もあるし。まぁ、一定数騙されてしまうんだろうから収益あがるんだろうし、結局やり得的な?
迷惑メール対策推進協議会の迷惑メール白書2020を見ると、2019年・2020年共に国内のメールのうちほぼ半分が迷惑メールだそうで、さらにウザい情報を仕入れてしまいました。

まぁ色々と考えてみたけど、迷惑メールの活用方法が浮かばず。とりあえず、迷惑メール情報提供と集計して成仏させることにしました。
※いち個人のメールアドレスに日々届く迷惑メールの集計データなので、すべてに当てはまるわけでもなく、考察がどのくらい適切であるかは議論の余地があると思っています。


メインではないアドレスに届いている迷惑メールのフォルダで2020年11月11日から2021年8月9日10時までに届いている271日分の迷惑メール1040通を集計しました。
平均して1日大体4通くらい来ているわけですね。少ない方だと思いますがもうウザい
ジャンルは様々でAmazonの支払いしろとかアカウント停止しているぞととか、エロ系、投資系、BCASカード売ります的なやつなど1つのジャンルでも複数の業者・種類があるような感じです。
メールの文章とかには興味がありません。
f:id:energy_note:20210809113802p:plain
これが曜日別の受信数です。月曜日と水曜日が少し多いのが気になりますね。日曜日は業者も休んでいるのでしょうか。
f:id:energy_note:20210809113816p:plain
続いて時間別の集計です。2時~3時、5時~6時、14時~15時、にピークがありますね。なんでしょう?
f:id:energy_note:20210809113826p:plain
これがAmazon関連の集計です。2時~3時、14時~15時のピークはこれでしょう。Amazonお急ぎ便が15時までの注文だからでしょうかね??それにしても夜中3時はよくわからない・・・
あと、23時~0時にほとんど来ていない点も何でしょう・・・?セールとかが終わる時間帯だから・・・?
f:id:energy_note:20210809113836p:plain
別ジャンルの集計結果です。狙っているのか、業者の活動時間なのかわかりませんが明らかに夜中に集中していますね。
夜中にメールを見て判断能力が落ちているときを狙っているのでしょうか。
あと、一斉送信による遅延なのかわかりませんが〇〇時ちょうど、のようなメールは少なく、大体が中途半端な時間です。
集計にものすごいエネルギーを使ってしまったので今回はこれまで・・・

夜中集中、ピーク時間帯の集中、はジャンル問わず似たような動きであることを観測しました。業者が違っていても、何かしら狙っている時間帯があるような感じですかね。
季節、イベント、セールetc...何かしらの要因で増減しているのを見るのも少し楽しそうではありますね。その辺で結果が出せるなら注意喚起とかもできるか?
ピークが重なったりしているのは機械学習とかでこの時間帯が熱い!とか出てるんでしょうか。だったら予測とかもできそう???
受信数が今のところ平均1日4通なので、少なすぎて信頼性に難ありですね。まぁわざと増やしたいとも思いませんが・・・
どこまでモチベーションが続くのかわからないこの集計ですが、もし面白そうな結果が出るのであれば②も・・・
news.livedoor.com
こんな人がいた・・・さすがにここまで活用するバイタリティーは持ち合わせていない・・・w