id
type
0
status
21
review version
1
cleanup version
2
pending deletion
0
created at
2023-12-05 19:21:45
updated at
2026-01-18 19:57:28
url
https://www.gzewikrawa.pl/4,redakcja
url length
36
url crc
1143
url crc32
1610351735
location type
1
canonical status
2
canonical page id
-
domain id
domain tld
616
domain parts
2
originating warc id
-
originating url
https://gzewikrawa.pl/sitemap.xml
source type
1
page id
title
Redakcja | BIULETYN INFORMACJI PUBLICZNEJ Gminny Zakład ds. Eksploatacji Wodociągów i Kanalizacji w Rawie Mazowieckiej
excerpt
content
author
Gminny Zakład ds. Eksploatacji Wodociągów i Kanalizacji w Rawie Mazowieckiej
updated
1769140441
block type
0
extracted fields
12
extracted bits
article author
title
detected location
0
detected language
121 (Polish)
category id
index version
1
paywall score
0
spam phrases
0
text nonlatin
0
text cyrillic
0
text characters
2597
text words
392
text unique words
194
text lines
71
text sentences
20
text paragraphs
3
text words per sentence
19
text matched phrases
0
text matched dictionaries
0
image author
featured image