Category: Data releases

  • Release 3.0.0

    Am muncit foarte mult în ultimele zile ca să publicăm o versiune îmbunătățită și actualizată a raportului la mijlocul intervalului dintre cele două tururi de scrutin. Astăzi avem plăcerea să lansăm raportul Cheile împărăției versiunea 3.0.0.

    Această versiune folosește o metodologie îmbunătățită de selectare a conturilor monitorizate, de amprentare a postărilor și de agregare a rețelelor în suprarețele; este de departe cea mai completă versiune dintre cele trei ediții de până acum:

    • Am eliminat rețele irelevante (rețeaua Poliției Române și câteva rețele internaționale fără conținut în limba română) deoarece generau atât costuri la scraping cât și confuzie pentru persoanele care consultau raportul;
    • Am eliminat atât rețeaua «Gabriel Dimofte» cât și cele câteva conturi din raportul 2.x care au fost închise între timp;

    În ciuda tuturor acestor conturi eliminate din raport, versiuea 3.0.0 conține 791 de conturi față de 750 în versiunea 2.x (și un reach total similar).

  • Release 2.2.0

    Lucrăm intens la a treia ediție a raportului (și ultima înainte de turul 2 al alegerilor din 18 mai), însă astăzi am decis să publicăm o actualizare finală a datelor din a doua versiune: raportul Cheile împărăției versiunea 2.2.0.

    Ca și în cazul versiunii 2.1.0, și de data asta am refolosit setul de date din versiunea 2.0.0; am actualizat metadatele conturilor (reach și conturi șterse) și am actualizat algoritmul de amprentare a postărilor ca să-l aliniem cu versiunea a treia a raportului. Probabil apar mici regrupări ale rețelelor, însă nu ar trebui să existe diferențe majore.

  • Release 2.1.0

    Ne face extraordinar de mare plăcere să anunțăm lansarea raportului Cheile împărăției versiunea 2.1.0:

    • Datele primare (conturi, postări și amprente) sunt identice cu cele folosite în versiunea 2.0.0, colectate în 27 aprilie;
    • Am actualizat metadatele tuturor conturilor (nume, număr de prieteni, urmăritori, etc) cu datele de astăzi;
      • Împărțirea în conturi active/inactive se face pe baza postărilor, prin urmare toate conturile marcate ca inactive în versiunea 2.0.0 au rămas marcate ca inactive chiar dacă în realitate au postări noi.
    • Am introdus conceptul de suprarețea (supercluster): dacă cel puțin o pereche de conturi din două rețele diferite distribuie un set de postări cu similaritate suficient de mare atunci considerăm că cele două rețele fac parte din aceeași suprarețea;
      • Există în continuare rețele distincte de orice suprarețele (e.g. România Ortodoxa);
      • Ordinea în raport este dată de reach sintetic total al suprarețelei sau rețelei;
      • Sunt indicate explicit statisticile totale ale suprarețelelor;
      • Numele suprarețelei este dat de numele celei mai mari rețele din suprarețea; ca și până acum, rețelele primesc numele celui mai mare cont din rețea.
    • Am adăugat câmpul deleted (true/false) în fișierul sursă; acesta indică dacă un cont a fost șters de la momentul colectării datelor până la momentul actualizării raportului:
    ...
    "accounts": {
        "100050644982328": {
          "name": "Destine de poveste",
          "profile_url": "https://www.facebook.com/DestineDePoveste",
          "stats": {
            "followers": 93000,
            "deleted": false
          },
    ...
  • Release 2.0.0

    Avem deosebita plăcere să anunțăm lansarea raportului Cheile împărăției versiunea 2.0.0, cu date descărcate în acest weekend. Am îmbunătățit metodologia, am extins căutarea la circa 35.000 de conturi însă am reușit să limităm numărul de postări descărcate; chiar și așa, în acest weekend tot am descărcat încă un milion de postări, două milioane de fișiere și 400 GB de date și am actualizat reach-ul tuturor conturilor din raport (prieteni, urmăritori și like-uri).

    Rezultatul este o versiune extinsă și actualizată a raportului: acum include 750 de conturi grupate în 61 de rețele, cu un reach total de peste 160 de milioane de like-uri, urmăritori și prieteni (conturile însele, nu postările lor).

  • Release 1.1.0

    Raport: Cheile împărăției v1.1.0

    Un release minor care nu modifică raportul, însă augumentează datele sintetice brute din versiunile anterioare cu data de scraping a postărilor și modifică convenția de denumire pentru data postării:

    Extras din Cheile împărăției v1.0.0 (00. sursă).json:

    "posts": [
            {
              "fingerprint": "...",
              "url": "...",
              "timestamp": "2025-04-02T15:38:02+00:00",
              "stats": {
                "likes": 7,
                "shares": 2
              }
            },

    Extras din Cheile împărăției v1.1.0 (00. sursă).json:

    "posts": [
            {
              "fingerprint": "...",
              "url": "...",
              "post_timestamp": "2025-04-02T15:38:02+00:00",
              "scrape_timestamp": "2025-04-21T12:40:11.520756",
              "stats": {
                "likes": 7,
                "shares": 2
              }
            },

    N.B.: fusul orar pentru scrape_timestamp este ora României.

  • Release 1.0.0

    Raport: Cheile împărăției v1.0.0

    După o lună de muncă, pe 22 aprilie 2025 am publicat prima versiune a raportului Cheile împărăției. Este o versiune preliminară pe care sperăm să o augumentăm cât mai curând cu conturi noi, folosind o metodologie îmbunătățită de selectare a conturilor și monitorizare a lor. Până acum cursa a fost de la nimic la publicarea unor rezultate, chiar și preliminare, în timp util pentru alegeri.

    Raportul este format din mai multe seturi de date, de la date sistetice brute până la documentul final, în așa fel încât să poată fi exploatat de un număr maxim de persoane, indiferent de competențele tehnice sau expertiza în politică, rețele sociale, comunicare sau dezinformare. Găsiți mai multe detalii despre seturile de date, grafuri și metodologie chiar în raportul Cheile împărăției. Pentru o privire mai largă de context despre proiectul nostru vă invităm să citiți despre misiunea noastră.

    Invităm presa, societatea civilă și instituțiile statului să consulte seturile de date din raport și să le folosească pentru monitorizarea rețelelor de formare și influențare a opiniei publice.