[PLUTO-security] Spam
Stefano Callegari
stefano at omniluxlighting.it
Fri Jul 18 11:59:46 CEST 2003
Il 17lug 12:36, Tom aka 'Dido' scrisse:
> Alle 11:30, giovedì 17 luglio 2003, Stefano Callegari ha scritto:
> >
> > > Allora come hai fatto? Immagino che si sia già sparsa la voce che il
> > > futuro dello spam passerà da qui. Così non ci sarà mai una regola
>
> A parte gli anti-spam "bayesiani", non credo ci voglia poi così tanto a
Ho appena installato il "bayesiano" spamoracle che si appoggia a
procmail.
Lo sto testando visto che non ho più spam per insegnargli i miei
"gusti". Man mano che mi arrivano gli spam li aggiungo.
> implementare un pre-parser che tolga i commenti in html dalle mail..
> Onestamente non ho mai provato alcuno di questi prodotti, ma penso che
> qualcosa del genere esista già! (vedi ad es sw free di ottimizzazione
> del codice html...
> http://www.pscode.com/vb/scripts/ShowCode.asp?txtCodeId=864&lngWId=8).
>
> Dido
>
Mi sono messo in caccia visto che volevo impiegare la bash.
Il problema fondamentale è che, partendo dall'esempio di spam
"commentato", sed elimina tutta la riga tra il primo "<!--" e l'ultimo
"-->". Oltre a questo, un commento può essere distribuito su più righe.
Prendiamo per esempio il testo (tratto dall'esempio originale)
<strong>G<!--8tnx55qpli-->
ene<!--oywkod2u03y2-->ric Vi<!--e1pesvi0tx3-->ag
<!--wzf2
bd33ko
n1m-->ra </strong>
Un uso "standard" di sed 's/<!--.*-->//g' darebbe come risultato
<strong>G
eneag
<!--wzf2
bd33ko
n1m-->ra </strong>
Come vedete nella seconda riga è sparito anche il testo fra i due
commenti, mentre il commento multilinea è ancora li.
Cercando fra vari esempi sono arrivato allo script
#! /bin/sed -f
# Delete HTML comments
# i.e. everything between <!-- and -->
# by Stewart Ravenhall <stewart.ravenhall at ukonline.co.uk>
# correzione per più commenti su una linea
# by Stefano Callegari
# raggruppa commenti multilinea su una sola
/<!--/!b
:a
/-->/!{
N
ba
}
# elimina i commenti
s/<!--[^\-]\+-->//g
L'esempio originale di spam commentato, passato sotto questo script,
restituisce (per chi non è bravo di enigmistica)
stefano at tecnico:~> cat prova_html_commento | rm_htlm_commenti
<strong>Generic Viagra </strong>
Ora lo metto in pipe in ~/.procmailrc prima di spamoracle. Vita dura
d'ora in poi per gli spammer :-)
Ciao
--
Stefano Callegari <stefano at omniluxlighting.it>
Omnilux Srl
Via Frassanedo, 2 - I 35020 Villatora di Saonara (PD)
+39 049 8792281
More information about the pluto-security
mailing list