energy note

色々と勉強中なので備忘録として。

迷惑メールを集計してみるか②

前回の記事がこちらです。
energy-note.hatenablog.com
集計開始から1年が経過しました・・・
相変わらず迷惑メールは止まる気配はなく、むしろ若干増えている?感じです。
www.dekyo.or.jp
届く迷惑メールはすべてこっちに情報提供しているのですが、変わる感じはないですね・・・途中から何のために情報提供しているのか疑問にすら思ってしまうくらい・・・
多分、同じ業者からのメールが多いっぽいのですが、これ約1年くらい続いていますよ・・・情報提供、意味あります?
URLは踏まずにドメイン検索してみると多分海外のサーバーっぽいんですが、それが引っかかっているのでしょうか。何にしてもうざすぎる。約1年もこの業者は何食わぬ顔で(たぶん)運営しているわけで。
情報を残しておくためと、何かあったときのために一応メールはすべて保存してあります。
別のことに時間を使いたいのですが途中で終わるのも嫌だし、ここまでまとめてしまったし、業者に一方的にやられ続けるのも癪だし、人様のリソースも奪い悪でしかないのは滅びてくれ!!(個人の問題)

集計結果は2020年11月11日から2021年11月12日です。366日分の受信件数が丁度1500件で1日あたり約4.1通受信していてとてもうざいことがわかります。(もっと受信している方4通程度で騒いですみません)


f:id:energy_note:20211113142554p:plain
まずは曜日ごとのデータですね。前回のまとめよりだいぶならされた感じはありますが、月曜日と水曜日はこれまでのピークを引きずっているのが大きいと思われます。前回より日曜日の受信件数が伸びています。嬉しくありません。
f:id:energy_note:20211113142522p:plain
時間ごとのデータもある程度ピークを引き継いでいますが、深夜の件数が伸びています。全然嬉しくありません。
23時~2時頃の受信数が少ないのも気になります。
f:id:energy_note:20211113151101p:plain
これはamazon関連の受信件数ですが、なぜかゴールデンウィークあたりから急激に下がりだしました。なぜでしょうか。全くうr・・・これは嬉しいw
多分だけどもその業者は処分されたのか、撤退したのか。処分されていたら倍に嬉しい。
f:id:energy_note:20211113151754p:plain
次は逆によくわからん内容(日本語がおかしいわけではない)の集計結果ですが、最近増えてきています。
クリックを狙っているのか、「今だと割引します!」だの、「テレビ番組が安くで見れます!」だの、中身がよくわからんのですよ。
f:id:energy_note:20211113160142p:plain
f:id:energy_note:20211113160206p:plain
次は曜日ごとの受信数です。
基本的に深夜の受信数が多いですが、水曜日は昼にピークがありますね。ノー残業デーを狙っているのでしょうか?w
金曜日も深夜が少ないです。日曜日の19時前後は家族団らん中で迷惑メールも見ないだろう、という魂胆・・・?
曜日ごとの時間変化については何かしら意図がありそうで。もし何もなくただ送ってたらそれはそれで笑われるだけなので、それもそれでウザいなぁw
f:id:energy_note:20211114100752p:plain
一応遊びで、ネット上の機械学習のサンプルからLSTMで受信件数を学習させてみたりして遊んでみましたが、データ数が少なすぎるのか全然今後の予測ができませんでした。
これに関しては今後さらにデータが集まって、機械学習の勉強ができた際にはいいおもちゃになるでしょう!こうやって利活用していかないとやってられません。
f:id:energy_note:20211113161104p:plain
最後にエロ系です。絶対数は少ないけど何か5時、23時付近に集中してるw

なんだかこれを機に統計について勉強したくなってきた。機械学習も少しいじったし、こういう意欲が湧いてくるのはせめてもの救い。
しかしグラフの考察が難しい!何かいい感じの処理を施したら面白いデータでも取れるのだろうか?

データ、グラフの無断使用はやめてください。
注意※暇ではありません。