id
name
processing priority
3
site type
0 (generic, awaiting analysis)
review version
11
html import
27 (unknown)
first seen date
2024-02-21 04:59:02
expired found date
-
created at
2024-07-03 03:01:54
updated at
2026-02-25 03:37:06
length
15
crc
29882
tld
156
nm parts
0
nm random digits
0
nm rare letters
0
is subdomain of id
-
previous id
0
replaced with id
0
related id
-
dns primary id
dns alternative id
0
lifecycle status
0 (unclassified, or currently active)
deleted subdomains
0
page imported products
0
page imported random
0
page imported parking
0
count skipped due to recent timeouts on the same server IP
0
count content received but rejected due to 11-799
0
count dns errors
0
count cert errors
0
count timeouts
0
count http 429
0
count http 404
0
count http 403
0
count http 5xx
0
next operation date
2026-02-26 00:43:52
server bits
—
server ip
-
mp import status
27
mp rejected date
-
mp saved date
-
mp size orig
10087
mp size raw text
1137
mp inner links count
0
mp inner links status
20 (imported)
title
description
image
site name
author
updated
2026-02-22 18:13:26
raw text
词泰科技有限公司 Navigation 首页 公司介绍 产品与服务 技术与研发 合作伙伴 诚聘英才 联系我们 Skip to navigation Skip to content 词泰科技有限公司 让您的信息产生价值 词泰科技有限公司 (WordTech Co.) 是一家致力于研发最新自然语言处理和信息搜索技术以及提供大规模文本处理和数据挖掘基础模块、解决方案和咨询服务的高科技公司。 自从成立以来,我们为客户提供高效和智能化的信息处理工具和咨询服务。在这个信息爆炸的时代,如何让互联网上和企业内部的海量信息为我们带来更多的价值需要高度智能化的信息处理工具。我们提供的技术能够高效并且准确的对大量文本信息进行处理、检索、挖掘、 翻译 等工作,并可方便地与信息系统的其他模块进行整合。 我们的技术 词泰科技一直站在自然语言处理和信息检索领域技术发展的前沿。 我们在以下领域拥有先进的研发实力和经验: 自动机器翻译 信息检索和搜索 自然语言处理 数据挖掘 机器学习 我们的产品在许多标准的国际评测指标中取得了领先的性能参数,并已经被广泛的应用在多家政府机构和大型知名互联网网站系统中(请参考 合作伙伴 )。您可根据自己的需要购买我公司相应的产品,也可授权某项技术以及其他类型的合作。 产品聚焦 我们提供文本信息处理的基础技术和服务,其产品涵盖机器 翻译 、搜索、信息挖掘、自然语言处理等领域。它们可以轻松地和企业自己的信息平台进行整合,关于各个产品的详细信息请查阅 产品与服务 : SmartTran® 中英文全文自动 机器翻译 系统。高效、准确,全文整句自动 翻译 ,无字数限制。并含有丰富的双语 例句 、 造句 和 example sentence 等 SmartMiner® 强大的 信息挖掘 工具。能帮你从海量无结构的文本中挖掘出您所需要的特定类型特定结构的信息(如 电话号码 等)。 IntraSeek® 全功能的 站内搜索引擎 使您网站里的信息让用户触手可得。安装使用及其方便,极强可定制性。 最新动态 5/09/17 Chinese Dictionary launched 11/09/12 ICCL 2012 ...
redirect type
0 (-)
block type
0 (no issues)
detected language
1 (English)
category id
Pozostałe (16)
index version
1
spam phrases
0
text nonlatin
667
text cyrillic
0
text characters
908
text words
117
text unique words
97
text lines
67
text sentences
2
text paragraphs
0
text words per sentence
58
text matched phrases
0
text matched dictionaries
0
links self subdomains
0
links other subdomains
links other domains
7 - languagecomputer.com, ichacha.net, chadianhua.net, coling2012-iitb.org, hindlish.com
links spam adult
0
links spam random
0
links spam expired
0
links ext activities
0
links ext ecommerce
0
links ext finance
0
links ext crypto
0
links ext booking
0
links ext news
0
links ext leaks
0
links ext ugc
0
links ext klim
0
links ext generic
1
dol status
0
dol updated
2026-02-22 18:13:26
rss path
rss status
0 (new)
rss found date
-
rss size orig
0
rss items
0
rss spam phrases
0
rss detected language
0 (awaiting analysis)
inbefore feed id
-
inbefore status
0 (new)
sitemap path
sitemap status
0 (new)
sitemap review version
2
sitemap urls count
0
sitemap urls adult
0
sitemap filtered products
0
sitemap filtered videos
0
sitemap found date
-
sitemap process date
-
sitemap first import date
-
sitemap last import date
-