Divertirsi con Pastebin e SharpScraper

Pochi giorni fa, nella mia eterna battaglia contro l’ignoranza, decisi di consolidare quel poco che avevo imparato di C# e MongoDB realizzando un progetto piuttosto semplice ma frutto di molte soddisfazioni: SharpScraper.

pastebin20simple
SharpScraper è un modestissimo scraper per Pastebin che si appoggia su ricerche basaste su regex ed un database MongoDB. Sto provando anche a realizzare un sito piuttosto base per visualizzare qualcuno dei risultati, SharpScarperWebsite.

Ma cos’è uno scraper? Semplicemente un programma che analizza tutti gli ultimi “paste” pubblicati su pastebin (da qui), ne legge il contenuto, controlla se il contenuto combacia con una ricerca definita nel codice (sfruttando le espressione regolari, le regex) ed in caso affermativo ne salva il contenuto all’interno di un database MongoDB. Semplice no?

L’ho lasciato attivo qualche ora, cercando qualsiasi paste contenesse un’indirizzo email (usando la regex “\w+([-+.’]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*”), con risultati quantomeno interessanti.

Si possono trovare diversi tipi di paste contenenti un indirizzo di posta:

  • “Innocenti” copia-incolla di informazioni personali

    Contact
    
    Email: [RIMOSSO]@mic.school.nz
  • Messaggi diretti a qualche community

    Hello!
    
    This post is regarding the network and it's future to entertain and provide all of you guys with a fun and friendly environment! I am very happy with the current standing on your Hardcore Factions Map 1.
    
    At the start of our Hardcore Factions map we ran into some issues with our back-end and front end that would have gave our players some lag and would of caused frustration. I can gladly say thanks to your support and patience all of these issues have been resolved and we are working day by day to improve the networks performance and release more and more things for you GUYS!
    
    BUT
    
    This post isn't about the current map, this is about the future of the Network! As a network we strive to base our future game modes and even development of our current Hardcore Factions server of the players ideas and wants.
    
    We have got a lot of future plans to grow the network for the better and make more and more game modes available to you so you can play and enjoy them with your friends!
    
    
    More information coming in a later post! 
    
    KohiSG
    KohiSG is a replica of the original survival games that was released on the kohi network!
    
    KohiSG is the comeback of the original Survival games brought in by the Kohi Network! This is a pot pvp style of survival games, where you will be put against 15 other opponents and fight to win. You have to collect items and try get the best gear possible before the timer runs out, or your slain by an enemy.
    
    PracticePVP
    PracticePVP is a replica of the original Practice that was released on the kohi network!
    
    PracticePVP is the comeback of the original Practice brought in by the Kohi Network! This is a pot pvp style, where you will be showing your skills!
    
    More information coming in a later post! 
    
    These are not only the plans we have for the network, but we are also working with a team of web developers to improve our community website and forums so you can navigate and communicate with people in a much easier way!
    
    We strive to have the best performing servers and the most creative minds in the community! As a network we want to listen to your ideas and suggestions and bring them to life! Please leave feedback and suggestions to improve the network in anyway shape or form.
    
    Regards,
    Aquiped & Management Team
    
    Contact community@arkanepvp.org with suggestions and feedback!
  • Messaggi di commit

    From f41c39680dd48bd6589f5509aa588a64ff9bed21 Mon Sep 17 00:00:00 2001
    From: Thomas Boerger <thomas@webhippie.de>
    Date: Sat, 28 Jan 2017 18:07:18 +0100
    Subject: [PATCH] Allow custom public files
    
    Signed-off-by: Thomas Boerger <thomas@webhippie.de>
    ---
     cmd/web.go                |  5 +++++
     modules/public/dynamic.go |  2 +-
     modules/public/public.go  | 17 +++++++++++++++++
     modules/public/static.go  |  2 +-
     4 files changed, 24 insertions(+), 2 deletions(-)
    
  • Annunci di vendita di account con relative password, i famosi leak contenenti tonnellate di informazioni personali, messi in vendita o semplicemente lasciati al pubblico ludibrio

    TUMBLR LEAKED DATABASE: 66 MILLION ACCOUNTS
     
    Here is the link to this hacked database:
    [RIMOSSO]
    
    
    This leak includes the emails and passwords for 66 MILLION tumblr users accounts.
    Just open up the database in your favorite text editor and Ctrl + F for the email you want to hack.
    
    Proof of content, first 100 lines of accounts:
    Format is email:password (password is SH1 hashed)
    
    
    [RIMOSSO]@gmail.com:c12233cbcc6b217d214c2e86ead8bba4bf44230a
    [RIMOSSO]@gmail.com:7d980fa41b59cc54d66b4845ff61f597e5e0763f
    [RIMOSSO]@gmail.com:e6d4b76e1924604afc512d429061d0adafd72571
    [RIMOSSO]@gmail.com:d9a6ae56e2db771e0da9af66310303da65ea72c2
    ...

    (Non ho testato personalmente la veridicità di questi dati, né ho intenzione di farlo, rimuovendo ogni informazione sensibile)

Insomma, un intero mondo a portata di mano, raggiungibile attraverso un semplice programmino da lasciar girare qualche ora sul nostro pc.

ATTENZIONE!

Non fidatevi delle informazioni che potreste trovare, il mondo è pieno di gente che non aspetta altro che trovare qualcuno abbastanza ingenuo da fidarsi di uno sconosciuto. Nessuno condivide nulla senza intenzioni precise, ed ormai il mondo è pieno di persone che sorvegliano questi siti.

Non provate ad abbassare i tempi di attesa tra una richiesta e l’altra nel codice sorgente del programma, Pastebin permette lo scraping del proprio sito, ma solamente ad una velocità molto ridotta. Se volete aumentare la velocità, chiedete un account a pagamento con accesso alla loro API.

Per usare il programma, aprite semplicemente la soluzione in visual studio insieme ad un’istanza di MongoDB. Non credo rilascerò direttamete il .exe finché il programma è inq uesto stato embrionale, voglio che la gente sia consapevole di cosa stia facendo prima di farlo.

Per qualsiasi domanda lasciate un commento, sarò felice di rispondervi!

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s