id
type
0 (not classified)
status
21 (imported old-v2, waiting for another import)
review version
0
cleanup version
0
pending deletion
0 (-)
created at
2025-11-30 15:41:49
updated at
2025-11-30 15:41:50
url
http://1dex.net/actualite-information/
url length
38
url crc
64062
url crc32
4178770494
location type
1 (url matches target location, page_location is empty)
canonical status
2 (missing canonical tag in html)
canonical page id
-
domain id
domain tld
2644
domain parts
0
originating warc id
-
originating url
https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151279927.26/warc/CC-MAIN-20250806232852-20250807022852-00549.warc.gz
source type
11 (CommonCrawl)
server ip
Publication date
2025-08-07 01:19:07
Fetch attempts
0
Original html size
13688
Normalized and saved size
12643
title
Actualité - Information
excerpt
content
Annuaire > Actualité - Information Actualité - Information Conseils et astuces pour vivre mieux Le site robotbuzz.fr est un site de partage de bons conseils et de bonnes astuces dont vous aurez besoin dans votre quotidien. Vous allez y trouver des conseils sur l’utilité et le mode d’emploi des derniers robots et tout ce qu’il y a à savoir... Ocila Ocila est un magazine internet qui propose des actualités et des conseils sur tous types de thématiques. Ce site est alimenté chaque semaine en contenu par des spécialistes de la rédaction et des domaines traités. Ce site propose de véritables... Retrouvez les différents sujets d’actualités sur Blabla et Pourquoi pas ! Vous souhaitez connaître les nouveaux sujets d'actualités ou profiter de nouvelles astuces ? Le blog qui parle de tout et de rien vous renseigne sur les nouvelles concernant divers domaines tels que la santé, l'immobilier,... Le Big Journal Le site internet Le Big Journal prop...
author
updated
1767155064
block type
0
extracted fields
104
extracted bits
title
full content
content was extracted heuristically
detected location
0
detected language
3 (French)
category id
index version
2025123101
paywall score
0
spam phrases
0
text nonlatin
0
text cyrillic
0
text characters
1823
text words
350
text unique words
188
text lines
1
text sentences
20
text paragraphs
1
text words per sentence
17
text matched phrases
1
text matched dictionaries
3
image author
featured image