Main

type

5 (blog/news article)

status

30 (imported + raw text content deleted)

review version

0

cleanup version

0

pending deletion

0 (-)

created at

2025-10-09 09:25:59

updated at

2025-10-09 09:25:59

Address

url

https://www.gratisoquasi.com/2013/03/campione-omaggio-di-caffe-jacobs-da.html

url length

77

url crc

26924

url crc32

3429525804

location type

1 (url matches target location, page_location is empty)

canonical status

10 (verified canonical url)

canonical page id

2704822051

Source

domain id

38873094

domain tld

2211

domain parts

0

originating warc id

-

originating url

https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151281028.48/warc/CC-MAIN-20250813055759-20250813085759-00796.warc.gz

source type

11 (CommonCrawl)

Server response

server ip

172.253.63.121

Publication date

2025-08-13 07:02:35

Fetch attempts

0

Original html size

139683

Normalized and saved size

77572

Content

title

Campione omaggio di Caffè Jacobs da Beiunszuhause

excerpt

content

Campione omaggio di Caffè Jacobs da Beiunszuhause WWW.GRATISOQUASI.COM Il campione omaggio di oggi arriva dal sito beiunszuhause.de e si tratta di un campioncino di caffè Per richiederlo CLICCATE QUI e nella pagina che si aprirà dovrete compilare il solito modulo con i dati per la spedizione. Il modulo di spedizione è in tedesco e nel modulo vanno inseriti nome, cognome, data di nascita,  indirizzio e-mail, indirizzo e numero civico, cap, città*. Infine selezionare il numero di quante persone è composta la famiglia,e sotto  inserire se ci sono minori di 18 anni e quanti sono. *nel campo "Ort" inserire oltre la città anche la nazione (es. Milano, Italien) Se il nostro blog è stato di tuo gradimento o vuoi ricevere aggiornamenti su articoli pubblicati consigliamo di: - iscriverti alla nostra newsletter (Riquadro in alto a destra della pagina), - segui  la nostra pagina facebook https://www.facebook.com/pages/Gratis-nel-Web/2614865838...

author

updated

1763032552

Text analysis

block type

0

extracted fields

105

extracted bits

featured image
title
full content
content was extracted heuristically

detected location

0

detected language

4 (Italian)

category id

Pozostałe (16)

index version

2025110801

paywall score

0

spam phrases

0

Text statistics

text nonlatin

0

text cyrillic

0

text characters

1039

text words

202

text unique words

134

text lines

1

text sentences

6

text paragraphs

1

text words per sentence

33

text matched phrases

0

text matched dictionaries

0