it-swarm.com.de

Wie filtere ich Nachrichten mit animiertem Emoji im Betreff von Google Mail?

Ich habe meinen Spam-Ordner durchsucht (was ich selten tue, da Google Mail selten falsche Positive enthält) und mir ist etwas Interessantes aufgefallen:

sample list of spam messages

Etwa die Hälfte der Nachrichten enthält mindestens ein animiertes Emoji im Betreff.

Keiner meiner Freunde würde diesen Mist gebrauchen. Keine gültige Firma, mit der ich Geschäfte machen würde, würde das jemals tun.

Wie kann ich einen Filter erstellen, um Nachrichten mit animiertem Emoji im Betreff möglicherweise automatisch zu löschen?

Unter Verwendung von jamesmstone s Hinweis unten habe ich eine Suche mit subject:=?UTF-8? und subject:"=?UTF-8?" und mehreren anderen Permutationen versucht, aber keine funktionierte.

Hier ist ein Beispielsatz mit Überschriften von einem dieser dampfenden Stapel:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <[email protected]>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) [email protected];
       dkim=pass [email protected];
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 [email protected]; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <[email protected]>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <[email protected]>
27
ale

Kurze Antwort

Erstellen Sie ein Skript mit der Methode GmailMessage :: getRawContent () von Google Apps Script, um die Nachrichten zu verarbeiten, anstatt Google Mail-Filter zu verwenden, die von der Google Mail-Suchfunktion abhängen, um nach den codierten Emojis in den Originalnachrichten zu suchen .

Verwandte Fragen

Im Folgenden finden Sie Links zu Antworten auf ähnliche Fragen auf dieser Website, einschließlich Skripts, die die angegebene Methode verwenden.

10
Rubén

Ich habe zu diesem Zweck ein Google Apps-Skript erstellt.

Es ist auf Github: https://github.com/spamzero/spamzero

Hiermit können Sie alle möglichen erweiterten Regeln erstellen, die Sie mit Ihrem Spam-Nachrichtenordner abgleichen können, sodass Nachrichten, die definitiv Spam sind, automatisch bereinigt werden.

4
Spam Zero

Dies ist nicht ganz das, wonach Sie fragen (Herausfiltern der Emojis selbst und nicht der Nachrichten mit Emojis), aber möglicherweise finden Sie einige der Inhalte nützlich, um einen besseren Nachrichtenfilter zu erstellen.

Es gibt jetzt ein Open-Source-User-Skript für Greasemonkey/Tampermonkey/Violentmonkey, um diese irritierenden visuellen Kakerlaken loszuwerden (nur die Zeichen, nicht die Nachrichten selbst):

Google Mail-Betreffzeile Emoji Roach Motel

Wenn Sie sich Quelle zu diesem Skript ansehen, werden Sie feststellen, dass es zwei allgemeine Arten von Emoji-Kakerlaken gibt, die Sie in E-Mails von missbräuchlichen Vermarktern finden (heutzutage leider auch von eBay und Amazon):

  • HTML-Bild-basierte Kakerlaken (einschließlich der schrecklichen animierten) aka goomoji

  • Unicode-Kakerlaken: Es gibt immer noch viele Emoji (und andere Unicode-Sequenzen, die Bilder erzeugen), die Spammer und andere frühere Vermarkter in E-Mail-Betreffzeilen verwenden und die von Google Mail nicht in HTML-Bilder konvertiert werden. In einigen Browsern werden diese fett und farbig dargestellt, was fast so schlecht ist wie Animationen. Browser könnten auch diese animieren, aber ich weiß nicht, ob es welche gibt. Diese Unicode-Sequenzen werden vom Browser als Unicode-Text angezeigt, sodass das genaue Erscheinungsbild (Farbe oder nicht, animiert oder nicht, ...) davon abhängt, welches Text-Rendering-System der Browser verwendet. Das Erscheinungsbild eines bestimmten Unicode-Emoji hängt auch von nicode-Variationsselektoren und Emoji-Modifikatoren ab, die in der Unicode-Codepunktsequenz in dessen Nähe angezeigt werden. Im Gegensatz zum bildbasierten Emoji-Spam können diese Sequenzen als Unicode-Text aus dem Browser in andere Apps kopiert und eingefügt werden.

Für den letzteren Typ enthält das Userscript einen regulären Ausdruck, mit dem die Unicode-Sequenzen erfasst werden, die von Marketingfachleuten möglicherweise missbraucht werden. Der reguläre Ausdruck sieht in ES6 Javascript so aus (das UserScript übersetzt dies mit dem erstaunlichen ES6 Regex Transpiler in einen weit verbreiteten regulären Ausdruck vor ES6):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
1
Louis Semprini