[PLUTO-security] Spam

Stefano Callegari stefano at omniluxlighting.it
Fri Jul 18 11:59:46 CEST 2003


Il 17lug 12:36, Tom aka 'Dido' scrisse:
> Alle 11:30, giovedì 17 luglio 2003, Stefano Callegari ha scritto:
> > 
> > > Allora come hai fatto? Immagino che si sia già sparsa la voce che il
> > > futuro dello spam passerà da qui. Così non ci sarà mai una regola
> 
> A parte gli anti-spam "bayesiani", non credo ci voglia poi così tanto a

Ho appena installato il "bayesiano" spamoracle che si appoggia a
procmail.

Lo sto testando visto che non ho più spam per insegnargli i miei
"gusti". Man mano che mi arrivano gli spam li aggiungo.

> implementare un pre-parser che tolga i commenti in html dalle mail..
> Onestamente non ho mai provato alcuno di questi prodotti, ma penso che
> qualcosa del genere esista già! (vedi ad es sw free di ottimizzazione
> del codice html...
> http://www.pscode.com/vb/scripts/ShowCode.asp?txtCodeId=864&lngWId=8).
> 
> Dido
> 

Mi sono messo in caccia visto che volevo impiegare la bash.

Il problema fondamentale è che, partendo dall'esempio di spam
"commentato", sed elimina tutta la riga tra il primo "<!--" e l'ultimo
"-->". Oltre a questo, un commento può essere distribuito su più righe.

Prendiamo per esempio il testo (tratto dall'esempio originale)

<strong>G<!--8tnx55qpli-->
ene<!--oywkod2u03y2-->ric Vi<!--e1pesvi0tx3-->ag
<!--wzf2
bd33ko
n1m-->ra </strong>

Un uso "standard" di sed 's/<!--.*-->//g' darebbe come risultato

<strong>G
eneag
<!--wzf2
bd33ko
n1m-->ra </strong>

Come vedete nella seconda riga è sparito anche il testo fra i due
commenti, mentre il commento multilinea è ancora li.

Cercando fra vari esempi sono arrivato allo script

#! /bin/sed -f
# Delete HTML comments
# i.e. everything between <!-- and -->
# by Stewart Ravenhall <stewart.ravenhall at ukonline.co.uk>

# correzione per più commenti su una linea
# by Stefano Callegari

# raggruppa commenti multilinea su una sola
/<!--/!b
:a
/-->/!{
        N
        ba
}

# elimina i commenti
s/<!--[^\-]\+-->//g

L'esempio originale di spam commentato, passato sotto questo script,
restituisce (per chi non è bravo di enigmistica)

stefano at tecnico:~> cat prova_html_commento | rm_htlm_commenti
<strong>Generic Viagra </strong>

Ora lo metto in pipe in ~/.procmailrc prima di spamoracle. Vita dura
d'ora in poi per gli spammer :-)

Ciao
-- 
Stefano Callegari <stefano at omniluxlighting.it>
Omnilux Srl
Via Frassanedo, 2 - I 35020 Villatora di Saonara (PD)
+39 049 8792281


More information about the pluto-security mailing list