id
processing priority
4
site type
3 (personal blog or private political site, e.g. Blogspot, Substack, also small blogs on own domains)
review version
11
html import
20 (imported)
first seen date
2024-08-24 00:29:46
expired found date
-
created at
2024-08-24 00:29:46
updated at
2025-04-22 11:55:42
length
28
crc
12816
tld
2211
nm parts
0
nm random digits
0
nm rare letters
0
is subdomain of id
13642151 (wordpress.com)
previous id
0
replaced with id
0
related id
-
dns primary id
0
dns alternative id
0
lifecycle status
0 (unclassified, or currently active)
deleted subdomains
0
page imported products
0
page imported random
0
page imported parking
0
count skipped due to recent timeouts on the same server IP
0
count content received but rejected due to 11-799
0
count dns errors
0
count cert errors
0
count timeouts
0
count http 429
0
count http 404
0
count http 403
0
count http 5xx
0
next operation date
-
server bits
—
server ip
-
mp import status
20
mp rejected date
-
mp saved date
-
mp size orig
278352
mp size raw text
109660
mp inner links count
98
mp inner links status
10 (links queued, awaiting import)
title
Hubert Guillaud
description
tentative de réassemblement
image
site name
Hubert Guillaud
author
updated
2026-03-08 01:50:53
raw text
Hubert Guillaud | tentative de réassemblement Hubert Guillaud tentative de réassemblement Menu Skip to content Home A propos – Contact Abonnez-vous Mentions légales Moteur de recherche Avec mes excuses… algorithmiques Mea culpa maxima ! Vous qui me lisez ici, qui êtes abonnés à ce blog automatiquement par RSS ou par mail, êtes assurément mes plus fidèles lecteurs… Et en fait, si vous ne me suivez pas sur les réseaux sociaux, vous n’êtes peut-être pas au courant que j’ai lancé un nouveau média. Il s’appelle Dans les algorithmes , et je veux croire que son titre dit clairement son objet. Il souhaite apporter à tous de la matière pour mieux comprendre les transformations sociales que produisent les données et les calculs sur la société. Ce média en ligne (pour l’instant une simple newsletter que nous transformerons en site à la rentrée) a déjà produit 8 numéros ( que vous pouvez lire par là ). Et je ne vous préviens que maintenant. Je m’en excuse platement… mais ce...
redirect type
0 (-)
block type
0 (no issues)
detected language
0 (awaiting analysis)
category id
Lorem ipsum (237)
index version
1
spam phrases
0
text nonlatin
0
text cyrillic
0
text characters
65535
text words
16495
text unique words
4050
text lines
634
text sentences
694
text paragraphs
113
text words per sentence
23
text matched phrases
0
text matched dictionaries
0
links self subdomains
0
links other subdomains
4 - cessp.cnrs.fr, journals.sas.ac.uk, gold.ac.uk, cis.cnrs.fr
links other domains
60 - danslesalgorithmes.net, matrice.io, loupcellard.com, guillaumeheuguet.com, cfeditions.com, firstmonday.org, charlietyson.com, cairn.info, ruhabenjamin.com, politybooks.com, internetactu.net, orithalpern.net, audimat-editions.fr, marionfourcade.org, kieranhealy.org, lafabrique.fr, mouton-numerique.org, maisouvaleweb.fr, benthamsgaze.org, framablog.org, cambridge.org, aoc.media, pol-editeur.com, editionstextuel.com, partieprenante.com, lemouvementassociatif.org, clubdesmediateurs.fr, vie-publique.fr, autrementautrement.com, seuil.com, ladernierelettre.fr, systext.org, miningwatch.ca, londonminingnetwork.org, bristoluniversitypress.co.uk, danmcquillan.org, actes-sud.fr, thesociologicalreview.org, nautil.us, computerweekly.com
links spam adult
0
links spam random
0
links spam expired
0
links ext activities
13
links ext ecommerce
0
links ext finance
0
links ext crypto
0
links ext booking
0
links ext news
15
links ext leaks
0
links ext ugc
34 - s0.wp.com, wp.me, s1.wp.com, wordpress.com, fr.wikipedia.org, facebook.com, instagram.com, twitter.com
links ext klim
0
links ext generic
0
dol status
0
dol updated
2026-03-08 01:50:53
rss status
32 (unknown)
rss found date
2024-08-26 20:16:46
rss size orig
163051
rss items
10
rss spam phrases
0
rss detected language
3 (French)
inbefore feed id
-
inbefore status
0 (new)
sitemap path
sitemap status
30 (processing completed, results pushed to table crawler_sitemaps.ext_domain_sitemap_lists)
sitemap review version
1
sitemap urls count
220
sitemap urls adult
0
sitemap filtered products
0
sitemap filtered videos
0
sitemap found date
2024-08-26 12:22:40
sitemap process date
2024-08-26 12:22:40
sitemap first import date
-
sitemap last import date
-