id
type
0 (not classified)
status
21 (imported old-v2, waiting for another import)
review version
0
cleanup version
0
pending deletion
0 (-)
created at
2025-10-30 05:12:16
updated at
2025-10-30 05:12:17
url
https://www.vinitech-sifel.com/content/actualites
url length
49
url crc
40632
url crc32
1606524600
location type
1 (url matches target location, page_location is empty)
canonical status
30 (canonical url is different, page_canonical_page_id points to it)
canonical page id
domain id
domain tld
2211
domain parts
0
originating warc id
-
originating url
https://data.commoncrawl.org/crawl-data/CC-MAIN-2025-33/segments/1754151280209.41/warc/CC-MAIN-20250810213209-20250811003209-00764.warc.gz
source type
11 (CommonCrawl)
server ip
Publication date
2025-08-10 23:38:35
Fetch attempts
0
Original html size
154479
Normalized and saved size
59411
title
excerpt
content
Le 13 novembre 2025, l’Hôtel de Région de Bordeaux accueillera la 4ᵉ édition d’Innov’Invest, seul forum d’investissement au monde entièrement dédié à la winetech.Lire l'articleLe Concours de Pitchs organisé sur la scène du Village Start-Up International a mis en lumière les start-ups les plus innovantes des filières vitivinicole, arboricole et maraîchère. Lire l'articleVous souhaitez évoluer dans le secteur vitivinicole ou envisager une reconversion professionnelle ? Lire l'articleL'Uruguay affiche son engagement envers une viticulture durable à Vinitech-Sifel 2024. Représenté par l’INAVI, l’Institut National de Viticulture, le pays souhaite renforcer ses liens internationaux et se maintenir à la pointe des pratiques durables. Lire l'articleCertains des meilleurs vins croates proviennent de l'Istrie, une péninsule située à l'extrémité nord-ouest de la côte adriatique du pays. La région entend profiter de sa présence à Vinitech-Sifel pour renforcer ses liens avec les marchés européens ...
author
updated
1762168705
block type
0
extracted fields
96
extracted bits
full content
content was extracted heuristically
detected location
0
detected language
3 (French)
category id
index version
2025110801
paywall score
0
spam phrases
0
text nonlatin
0
text cyrillic
0
text characters
4008
text words
680
text unique words
374
text lines
1
text sentences
21
text paragraphs
1
text words per sentence
32
text matched phrases
2
text matched dictionaries
2
links self subdomains
0
links other subdomains
68
links other domains
0
links spam adult
0
links spam random
0
links spam expired
0
links ext activities
0
links ext ecommerce
0
links ext finance
0
links ext crypto
0
links ext booking
0
links ext news
0
links ext leaks
0
links ext ugc
3
links ext klim
0
links ext generic
0