Včera jsem zase půl dne místo normální práce mazal spam. Mám na webu diskusní fórum, které je přístupné bez registrace a už jsem udělal snad všechno možné i nemožné abych se zbavil spamu, ale stále neúspěšně..

Problém je možná v tom, že k diskusnímu fóru, o kterém je řeč, je volný přístup, takže není potřeba se zaregistrovat.

Při vkládání příspěvků nechci obtěžovat uživatele, takže nepoužívam captchu ani žádný jiný turingův test. Navíc tohle řešení má docela dost nedostatků. Například v případě, že uživatel není schopen vyřešit kvadratickou rovnici, kterou mu zadám jako test, tak má smůlu. Nebo když má někdo třeba horší zrak a místo textu v obrázku vidí jenom rozmazaný flek (viz. obrázky v článku na zpravy.net), tak má taky smůlu.

Na zacačátku jsem napsal, že jsem udělal možné i nemožne, takže co jsem vlastně udělal?

Mám tam filtr klíčových slov, ve kterém mám naházených > 100 výrazů, většinou adresy na které v minulosti linkovali spameři a několik profláknutých výrazů jako jsou jména různých přípravků na zvětšení můžského přirození apod.

Nastavil jsem časový limit pro vložení jednoho příspěvku ze stejné ip adresy na maximálně 1 zpráva za 30 sekund z jedné ip adresy.

Mno a nakonec jsem ze sebe udělal otroka, který má po ruce RSS čtečku, ve které se mu každých 10 minut stahují nové příspěvky a otrok rozpoznává spam a přidáva klíčové slova do filtru a odmazává nové spamy.

Tohle všechno bylo až do nedávna docela fajn a nějak to fungovalo. Včera množství spamu překročilo únosnou míru ( > 1000 příspěvků). Příspěvky prostě chodí z celého světa a hlídat si kolik příspěvků chodí ze stejné ip adresy prostě nestačí. Takže jsem přemýšlel proč to spameři vlastně dělají a jakým způsobem je buď odradit od spamování nebo většinu spamu nějak odfiltrovat. Vycházel jsem z názoru, že zádný rozumný uživatel přece na spam v disksním fóru neklikne, takže hlavním důvodem bude zřejmě SEO.

Na základě téhle úvahy jsem vytvořil nové pravidlo fitrování, které umožní poslat za 10 minut maximálně 10 zpráv obsahující nějakou url.

Tak a teď už mi zbývá jenom čekat jak dopadne další spamerský útok..

[poll=3]

Loading

By Jozef Mlích

Software Developer at GreyCortex, NemoMobile contributor, Micro light aircraft pilot, OpenAlt Conference organizer

11 thoughts on “zase spameři”
  1. ted jsem prochazel par clanku a napadl me dalsi zpusob ochrany. co takhle neco ve smyslu puzzle skladanem z n-uhelniku(ctverce, trojuhelniky…)? uzivatel by dostal jednu cast obrazku a musel by k ni pro pokracovani spravne priradit druhou (nebo i vice). soucasti obrazku by mohl byt treba text nebo symbol(pripadne textove pokyny pro spravne umisteni casti) pro ztizeni prace robotum. problemem by asi bylo dynamicke generovani obrazku, takze by musela pritomna databaze s obrazky (konecny pocet reseni) – coz mi take nepripada optimalni.

  2. ano, turinguv test. Pokud jsou treba 4 moznosti, tak je pravdepodobnost 25%, ze spamer nahodne uhodne spravnou odpoved.

  3. Není lepší nechat políčko pro vyplnění nějakého jednoduchého čísla, třeba "napiš trojku", přičemž se pole automaticky JavaScriptem vyplní a skryje tak, aby uživatel o ochraně vůbec nevěděl? Ti bez JS by pak jen napsali do pole "3". Přijde mi to lepší než filtr slov a podobné věci.

  4. Ano, taky doporučuji články na rootu. Konkrétně bych vyzkoušel nějaké to opsání textu (slovem, číslicí, ale hodně proměnné), za druhé potom potvrzení na další stránce (třeba s výpisem všech/nového příspěvku, aby si robot myslel, že už to tam je), případně víc tlačítek apod. Možností je spousta a myslím, že dnes to ještě jde nakombinovat spolehlivě.

  5. Vidíte tady nějaký spam? asi ne
    Vidíte tu captchu nebo nějaké doplňovačky či opisovačky? taky ne
    prostě vyřešit to jde, ale budete muset využít několik metod najednou, jedna (byť dobře myšlená) nestačí

  6. mno v kazdem pripade nemam rad antispamove metody, ktere obtezuji uzivatele. Taky si nedelam zadne iluze o tom, ze by me spasila 1 metoda – tuhle jsem tam ted pridal, tak jsem o tom napsal do blogisku.

    Je sice pekne, ze to jde a ze se o tom da nalezt nekde obcas i clanek na netu, ale kdyz jsem zkousel hledat na rootu, tak jsem zjistit jenom to, ze klicove slovo ‘spam’ asi neni to prave (naslo 478 polozek). Kdyz sem pridate linky primo na clanky k tematu, tak se myslim takova reklama snese.

  7. [8] pěkné články.
    btw právě jsem vymazal zase 600 spamů, tak jsem přemýšlel o zlepšení zabezpečení mého fóra a napadli mě v podstatě 2 věci:
    – použít na kontrolu zpráv takové řešení, které se už dost dlouho používá proti emailovému spamu (spamassasin, apod.).
    – nechat normální uživatelé označovat zprávy jako spam – ja bych jenom přišel a potvrdil odstranění spamu a jim by spam zmizel hned po označení.

  8. Jak píše o několik příspěvků výše Stříbrný. Používám taky předvyplňování čísla Javascriptem a nemám ani jeden spam. To proč to dělají je kvůli vyhledávačům a SEO. Zrušit uplně odkazy, sice to všechny spammery neodradí ale aspoň ty co si kontrolují jestli se odkaz objevil.

  9. ja mam pocit, ze autorum spamu jde spise nez o SEO jenom o pouhe otravovani.

    Kdyz nas budou fakt hodne nasirat, pak vsichni radi prijmou regulovany, neanonymni internet 2 s ipv6 a se podepsanym kazdym packetem co se kde sustne.

    Stary internet s ipv4 bude ponechan samovolnemu rozkladu na pomalych linkach a uzivatele se vzdaji anonymity a neutrality internetu vymenou za bezspamovy internet regulovany vladou a firmama. No, fakt pekny.

    Amerika i EU se ted silne snazi internet ‘regulovat’ (cenzurovat) a kdyz se jim to podari, zase budou lidi muset psat samizdaty na papirku. :)

Comments are closed.