Ecco i figli segreti del Dread, in un prato tipicamente scozzese.
Gli interessati al mio script per scaricare tutte le immagini da una (o più) board di 4chan possono scrivermi. Non lo metto online per evitare di sovraccaricare i loro poveri server, già al limite...
Per usenet invece, sfrutto i servizi di un provider "privato" che pago uno o due euro al mese (grazie al dollaro basso) e ho tutti i binari che voglio, in particolare le immagini. Tutte le notti cron+brag sul piccolo Mac Mini di famiglia si fanno una visita a diversi gruppi della gerarchia "alt.binaries"...
So che le menti depravate che frequentano questo blog salterrano subito alla possibilità di scaricare giga e giga di robba porno, ma no, la mia collezione contiene sì qualche gnoccolona, ma sempre in pose più che decenti e senza troppa pelle esposta all'aria.
Qualche statistica:
Sfondi (>1024x768): 4606
Altre immagini: 6140
Ogni settimana ne scarico (automaticamente) circa un migliaio, di cui ne tengo in media 4 o 5. Ho già una serie di filtri messi in piedi che filtrano la spazzatura più evidente.
Va un po' a periodi, ma in genere si va da un 40 ad un 70% di pornografia (e io scarico solo da gruppi non-porno!) di cui un 2-3% maschi-femmine, un 5-10% lesbo e qualche rarissima occorrenza di gay maschile. Il resto sono tutti nudi femminili (detti soft-core dagli addetti al settore)
Mi piacerebbe mettere insieme un sistema di clustering e dargli in pasto tutto questo flusso di rumenta, per vedere se si riesce a filtrare qualcosa in più automaticamente. Un altro grosso problema che ho sono i duplicati a risoluzioni diverse...
Mi piace sto coso.
RispondiElimina1) Quale è sto provider misterioso?
2) Per il problema del sovraccarico non si potrebbero impostare dei limiti?
3) i filtri su cosa sono basati?