Main

type

0 (not classified)

status

21 (imported old-v2, waiting for another import)

review version

0

cleanup version

0

pending deletion

0 (-)

created at

2025-11-30 15:41:49

updated at

2025-11-30 15:41:50

Address

url

http://1dex.net/actualite-information/

url length

38

url crc

64062

url crc32

4178770494

location type

1 (url matches target location, page_location is empty)

canonical status

2 (missing canonical tag in html)

canonical page id

-

Source

domain id

9010356

domain tld

2644

domain parts

0

originating warc id

-

originating url

https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151279927.26/warc/CC-MAIN-20250806232852-20250807022852-00549.warc.gz

source type

11 (CommonCrawl)

Server response

server ip

213.186.33.19

Publication date

2025-08-07 01:19:07

Fetch attempts

0

Original html size

13688

Normalized and saved size

12643

Content

title

Actualité - Information

excerpt

content

Annuaire > Actualité - Information Actualité - Information Conseils et astuces pour vivre mieux Le site robotbuzz.fr est un site de partage de bons conseils et de bonnes astuces dont vous aurez besoin dans votre quotidien. Vous allez y trouver des conseils sur l’utilité et le mode d’emploi des derniers robots et tout ce qu’il y a à savoir... Ocila Ocila est un magazine internet qui propose des actualités et des conseils sur tous types de thématiques. Ce site est alimenté chaque semaine en contenu par des spécialistes de la rédaction et des domaines traités. Ce site propose de véritables... Retrouvez les différents sujets d’actualités sur Blabla et Pourquoi pas ! Vous souhaitez connaître les nouveaux sujets d'actualités ou profiter de nouvelles astuces ? Le blog qui parle de tout et de rien vous renseigne sur les nouvelles concernant divers domaines tels que la santé, l'immobilier,... Le Big Journal Le site internet Le Big Journal prop...

author

updated

1767155064

Text analysis

block type

0

extracted fields

104

extracted bits

title
full content
content was extracted heuristically

detected location

0

detected language

3 (French)

index version

2025123101

paywall score

0

spam phrases

0

Text statistics

text nonlatin

0

text cyrillic

0

text characters

1823

text words

350

text unique words

188

text lines

1

text sentences

20

text paragraphs

1

text words per sentence

17

text matched phrases

1

text matched dictionaries

3