Main

type

0 (not classified)

status

21 (imported old-v2, waiting for another import)

review version

0

cleanup version

0

pending deletion

0 (-)

created at

2025-11-08 01:10:13

updated at

2025-11-08 01:10:14

Address

url

http://atvmed.dfirma.pl/polityka-prywatnosci

url length

44

url crc

30988

url crc32

1474001164

location type

1 (url matches target location, page_location is empty)

canonical status

30 (canonical url is different, page_canonical_page_id points to it)

canonical page id

2992334560

Source

domain id

522794745

domain tld

616

domain parts

0

originating warc id

-

originating url

https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151280090.92/warc/CC-MAIN-20250809075926-20250809105926-00559.warc.gz

source type

11 (CommonCrawl)

Server response

server ip

109.95.157.167

Publication date

2025-08-09 08:02:56

Fetch attempts

0

Original html size

21842

Normalized and saved size

17349

Content

title

Polityka prywatności - ATVmedia - ODKRYJ NOWE MOŻLIWOŚCI!

excerpt

content

POLITYKA PRYWATNOŚCI: Serwis nie zbiera w sposób automatyczny żadnych informacji, z wyjątkiem informacji zawartych w plikach cookies. Pliki cookies (tzw. „ciasteczka”) stanowią dane informatyczne, w szczególności pliki tekstowe, które przechowywane są w urządzeniu końcowym Użytkownika Serwisu i przeznaczone są do korzystania ze stron internetowych Serwisu. Cookies zazwyczaj zawierają nazwę strony internetowej, z której pochodzą, czas przechowywania ich na urządzeniu końcowym oraz unikalny numer. Podmiotem zamieszczającym na urządzeniu końcowym Użytkownika Serwisu pliki cookies oraz uzyskującym do nich dostęp jest operator. Pliki cookies wykorzystywane są w celu: a)      dostosowania zawartości stron internetowych Serwisu do preferencji Użytkownika oraz optymalizacji korzystania ze stron internetowych; w szczególności pliki te pozwalają rozpoznać urządzenie Użytkownika Serwisu i odpowiednio wyświetlić stronę internetow...

author

Agencja Interaktywna Triso.pl

updated

1767362591

Text analysis

block type

0

extracted fields

108

extracted bits

article author
title
full content
content was extracted heuristically

detected location

40

detected language

121 (Polish)

category id

Prywatność (20)

index version

2025123101

paywall score

0

spam phrases

0

Text statistics

text nonlatin

0

text cyrillic

0

text characters

6328

text words

917

text unique words

440

text lines

1

text sentences

43

text paragraphs

1

text words per sentence

21

text matched phrases

10

text matched dictionaries

4