id
type
0
status
21
review version
0
cleanup version
0
pending deletion
0
created at
2025-12-12 07:46:07
updated at
2025-12-12 07:46:07
url
https://www.wp.pl/?s=https%3A%2F%2Fwiadomosci.wp.pl%2Fzbigniew-ziobro-chce-bezwzglednego-dozywocia-minister-w-kprm-nie-ukrywal-emocji-6646784670185089v&nil=&src01=f1e45&src02=isgf
url length
179
url crc
6341
url crc32
633608389
location type
1
canonical status
30
canonical page id
domain id
domain tld
616
domain parts
0
originating warc id
-
originating url
https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151279837.14/warc/CC-MAIN-20250805001900-20250805031900-00088.warc.gz
source type
11
page id
title
Wirtualna Polska - Wszystko co ważne - www.wp.pl
excerpt
content
Pobieranie, zwielokrotnianie, przechowywanie lub jakiekolwiek inne wykorzystywanie treści dostępnych w niniejszym serwisie - bez względu na ich charakter i sposób wyrażenia (w szczególności lecz nie wyłącznie: słowne, słowno-muzyczne, muzyczne, audiowizualne, audialne, tekstowe, graficzne i zawarte w nich dane i informacje, bazy danych i zawarte w nich dane) oraz formę (np. literackie, publicystyczne, naukowe, kartograficzne, programy komputerowe, plastyczne, fotograficzne) wymaga uprzedniej i jednoznacznej zgody Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, będącej właścicielem niniejszego serwisu, bez względu na sposób ich eksploracji i wykorzystaną metodę (manualną lub zautomatyzowaną technikę, w tym z użyciem programów uczenia maszynowego lub sztucznej inteligencji). Powyższe zastrzeżenie nie dotyczy wykorzystywania jedynie w celu ułatwienia ich wyszukiwania przez wyszukiwarki internetowe oraz korzystania w ramach stosunków umownych lub dozwolonego użytku określoneg...
author
Wirtualna Polska
updated
1767563633
block type
0
extracted fields
109
extracted bits
featured image
article author
title
full content
content was extracted heuristically
detected location
0
detected language
121 (Polish)
category id
-
index version
1
paywall score
0
spam phrases
0
text nonlatin
0
text cyrillic
0
text characters
940
text words
134
text unique words
105
text lines
1
text sentences
3
text paragraphs
1
text words per sentence
44
text matched phrases
0
text matched dictionaries
0
links self subdomains
0
links other subdomains
32
links other domains
50
links spam adult
0
links spam random
0
links spam expired
0
links ext activities
11
links ext ecommerce
0
links ext finance
0
links ext crypto
0
links ext booking
0
links ext news
255
links ext leaks
0
links ext ugc
0
links ext klim
0
links ext generic
1
image author
featured image