Main

type

5 (blog/news article)

status

21 (imported old-v2, waiting for another import)

review version

0

cleanup version

0

pending deletion

0 (-)

created at

2025-11-06 04:30:56

updated at

2025-11-06 04:30:56

Address

url

https://cfg.wtal.de/2020/05/

url length

28

url crc

48643

url crc32

3964714499

location type

1 (url matches target location, page_location is empty)

canonical status

2 (missing canonical tag in html)

canonical page id

-

Source

domain id

295457331

domain tld

276

domain parts

0

originating warc id

-

originating url

https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151280106.5/warc/CC-MAIN-20250809141352-20250809171352-00985.warc.gz

source type

11 (CommonCrawl)

Server response

server ip

195.8.239.133

Publication date

2025-08-09 15:01:30

Fetch attempts

0

Original html size

119446

Normalized and saved size

59737

Content

title

Mai 2020 – Carl-Fuhlrott-Gymnasium Wuppertal

excerpt

content

Allgemein Artikel wird fortlaufend ergänzt Text und Fotos von M. Pick und J. Redetzky 19.05.2020: Alle Jahrgänge wieder in der Schule Nach einer guten Woche haben inzwischen alle Jahrgänge am CFG ihre Mitschüler und Lehrer im […] Allgemein Text von H. Jülicher Böker, Foto von Zoé Gimmler Trotz Corona und Schulschließung konnte auch in diesem Jahr Anfang Mai unser traditioneller EU-Projekttag durchgeführt werden, wenn auch etwas anders als ursprünglich geplant. Die Schülerinnen und […] Mitteilungen Hier finden Sie, chronologisch sortiert und regelmäßig aktualisiert, alle Informationsbriefe, die an Eltern und Schüler*innen herausgeschickt wurden. Informationsbriefe für Eltern Informationsbriefe für Schülerinnen und Schüler Mitteilungen Die Haltestelle Toelleturm in Fahrtrichtung Ronsdorf kann ab Montag, 18.05.2020 nicht angefa...

author

updated

1764355801

Text analysis

block type

0

extracted fields

104

extracted bits

title
full content
content was extracted heuristically

detected location

0

detected language

2 (German)

category id

Pozostałe (16)

index version

2025110801

paywall score

0

spam phrases

0

Text statistics

text nonlatin

0

text cyrillic

0

text characters

1599

text words

269

text unique words

173

text lines

1

text sentences

14

text paragraphs

1

text words per sentence

19

text matched phrases

0

text matched dictionaries

0