Zu automatisierten Filtern kann ich nach meiner Erfahrung nur folgendes sagen:
Tutorials und Scripts zum Entwickeln einer Blacklist direkt gibt es leider nicht, da es im Prinzip immer auf dasselbe hinausläuft:
Eine riesige Liste mit Wörtern (ob nun aus einer Datenbank oder Text-Datei), die mit der Eingabe entweder auf reguläre (vordefinierte) Suchmuster oder auf übereinstimmende Strings überprüft wird.
Diese Liste muss leider erst "von Hand" selber angefertigt werden, da nicht jeder den Geschmack über anstößige bzw. bösartige Wörter teilt. Da das recht aufwendig ist, wird wohl kaum einer seine mühsame Arbeit öffentlich bereitstellen.
(Schade eigentlich. Wenn ich die Zeit hätte, würde ich gleich ein Modul dazu schreiben

)
Programmiertechnisch wird dazu meist auch eine FOR-Schleife verwendet.
Also am besten sucht man nach solchen Tutorials, die Schleifen, Vergleiche und evtl. auch Ersetzen von Werten aus einer "Menge" beinhalten.
Hier nur einige Anwendungsbeispiele, die sich zufällig auch mit "Bad Words" beschäftigen:
http://gr0w.com/articles/code/php_bad_words_filter/
http://www.phpforum.de/archiv_22026_Bad ... eigen.html
http://www.webmasterworld.com/forum88/3810.htm
Die Entwicklung einer "Blacklist" oder "Bad words list" ähnelt meiner Meinung nach der von Virenscannern.
Die Listen müssen ständig erneuert werden.
Immer dort wo nicht eindeutig bestimmbare Inhalte gefiltert werden sollen, wird leider eines außer Acht gelassen:
Der Faktor "Mensch".
Der Kreativität des Menschen ist leider keine Grenze gesetzt, und so wird er immer Wege finden, die ein oder andere Sperre zu umgehen. Getreu dem Motto "Wenn es einen Weg hinein gibt, gibt es auch einen Weg hinaus".
Weiterhin - gerade bei Wörtern - führt eben diese Kreativität auch dazu, dass wir in der Lage sind Wörter zu erkennen, wo gar keine sind.
Bsp.: "B4DW0RT", "$hit", "d00f", "5UCK MY D1G" usw.
Mal abgesehen von dem Problem, dass "böse" Wörter in jeder Sprache vorkommen und es demnach nicht möglich ist, eine universelle Blacklist zu erstellen, gibt es leider keine Software, die den
Sinn eines Textes bzw. eines Wortes erfassen kann. Es kann nur auf Buchstaben geprüft werden.
Worte wie "Fook you" würden von kaum einer Software gefiltert werden, die auf reguläre Ausdrücke prüft, jedoch jeder Mensch würde verstehen was damit gemeint ist.
Einzige Alternative wäre, die beiden Faktoren "Mensch-Maschine" gemeinsam filtern zu lassen.
Eine interessante (etwas ältere) Diskussion hierzu gibt es z.B. im SelfHTML-Forum:
http://forum.de.selfhtml.org/archiv/2004/6/t82962/
Im Zusammenhang mit den Modulen SelfReg oder FEU kann ich nur sagen, dass man nicht drumherum kommt, eine riesige Liste mit genauen Wörtern bzw. regulären Ausdrücken selbst zu erstellen. Oder es findet sich jemand, der das schonmal gemacht hat und seine Liste zur Verfügung stellt.