
信息提取软件简介

笊篱指一种做饭用的工具,象勺子,有眼儿,主要实现烹饪过程中食品与油、汤分离。在处理Word文档时我们也希望有一个笊篱一样的工具,把我们想要的内容过滤出来。
信息提取软件就是一个像笊篱一样的工具软件,能批量读取 Word文档中指定内容,并把指定内容转到Excel文档中的软件。当工作中需要重复地把Word文档的部分内容复制粘贴到新的表格中时,信息提取软件就能代替您工作。如何购买
使用信息提取软件有两个方法,用户购买信息提取软件,自己提取Word文档中的信息,或委托元泰数据管理公司提取信息。用户还可以免费在线提取Word文档内容,可前住体验。操作指导
要使用在线提取功能,您的电脑需要具备下面的运行环境:
一、.net Framework 2.0
二、浏览器允许下载未经签名的ActiveX控件
三、下载安装文件,安装提取软件。下载
如果您的电脑具备了上述环境,可直接体验提取软件。直接体验提取软件,每次只能提取一份文件的内容,每天限提取10次
有了体验后,您要是想经常使用信息提取软件,您可以向元泰公司购买该软件在网上的使用服务。长期使用的方法
用途大学图书馆接收学生递交的毕业论文后,用信息提取软件建论文索引
政府机关接到其他机关单位报送的申请表后,用信息提取软件生成花名册、一览表
大的区域性公司收到下面公司报送的报表后,用信息提取软件生成新的统计报表
政府机关在报送政府公开信息时,使用信息提取软件自动生成政府公开信息报送目录
使用实例
某人事管理机关负责审查报送的人才培养经费申请表,在经专家审核后,发放相关经费。报送的材料一般为纸质和电子的两套。为准备专家评审会,机关业务人员需要编制一份包含所有申请人的花名册。一般情况下,具体工作人员要打开一份份的电子版的申请表,从中摘出申请人的姓名、性别、学历、工作单位、培养内容、申请人所在省市自治区等内容,制成花名册,供评审组专家在会上使用。工作人员需要不停地复制、粘贴,处理一份申请表需要花费 3-5分钟时间,如果该人事管理机关需要处理100个这样的申请表,可能需要一天的时间。这项工作需要精力集中,如果工作人员在处理申请表时还要接电话和其他业务,更要很长时间才能完成。如果使用信息提取软件来处理,几分钟就处理完了,软件可自动生成一个Excel格式的花名册,供上会使用。
大学图书馆需要接收毕业生的毕业论文,建论文索引,供今后检索使用。但每年几千论文的录入工作量让人却步,使用信息提取软件后可轻松完成这项工作。大学图书馆可设 一论文接收入口,如邮箱或FTP上传窗口。在接收学生上传的论文后,可使用信息提取软件自动生成论文目录。
下级公司定期撰写 Word格式的业绩报告,内含有关业绩的统计数字,上级公司需要收集这些数字,生成Excel格式的报表,进行进一步的统计分析。在手工收集的情况下,需要工作人员分别打开每一个业绩报告,将其内容复制到新的表格中,不停地调整格式,耗时费力才能完成任务。用信息提取软件就可以自动完成相关内容的提取任务。
按《政府公开信息条例》的要求,各机关要向档案馆、图书馆等政府公开信息阅览场所报送要公开的文件。档案馆和其他接收单位在接收信息后要为这些信息做目录,以便今后检索。当接收的文件很多的时候,这录入工作量会很大。用信息提取软件可以自动对接收的电子版的文档进行处理,生成机读目录。
要想正确使用信息提取软件,还需要使用嵌入 XML标记的文档模板。这样的文档模板可自己设计,也可委托给元泰公司完成。
示例:大学图书馆把一份份的毕业论文相关内容提取出来,生成论文索引
示例:两份学生论文,Word文档
基于元数据的信息交换
学院名称:计算机学院 专业:电子商务 年级: 2006级 指导教师:赵喜才 日期: 2010.6.10 |
XML在文件管理上的应用
学院名称:计算机学院 专业:软件工程 年级: 2005级 指导教师: 斯勤图 日期: 2009.6.10 |
示例:用信息提取软件自动生成的论文索引,Excel格式
论文索引
| 学生姓名 | 论文题目 | 学院名称 | 专业 | 年级 | 指导教师 | 日期 |
| 赵小玲 | 基于元数据的信息交换 | 计算机学院 | 电子商务 | 2006年 | 赵喜才 | 2010.8 |
| 哈斯朝鲁 | XML在文件管理上的应用 | 计算机学院 | 软件工程 | 2005年 | 斯勤图 | 2009.8 |
… |
示例:政府机关把一份份的申请表内容提取出来,生成花名册。下面是两个申请表,
经费申请表
姓名 |
张顺平 |
申请类别 |
个人类 |
毕业院校 |
北大 |
相 片 |
|||||||
性别 |
男 |
民族 |
汉族 |
身份证/护照号 |
191010101 |
||||||||
出生日期 |
|
出生地 |
上海市徐家汇区 |
||||||||||
申请项目 |
材料工程研究 |
现有技术职务 |
高工 |
金额 |
2万 |
||||||||
经费申请表
姓名 |
赵承淑 |
申请类别 |
出国类 |
毕业院校 |
辽大 |
相 片 |
||||||||
性别 |
女 |
民族 |
朝鲜族 |
身份证/护照号 |
111010101 |
|||||||||
出生日期 |
|
出生地 |
辽宁省沈阳市 |
|||||||||||
申请项目 |
农业统计学比较 |
现有技术职务 |
高工 |
金额 |
4万 |
|||||||||
过去办理这些申请表时,都是手工复制每个项目的内容,再粘贴到花名册的相应位置中。一会儿按鼠标在Word和Excel中切换,一会儿按键盘复制、粘贴,劳心、费眼,一天下来,吃饭的力气也没有了。为什么不用信息提取软件来自动处理呢?
使用信息提取软件自动提取相关内容生成的花名册
花名册
| 姓名 | 申请类别 | 毕业院校 | 性别 | 民族 | 出生日期 | 出生地 | 申请项目 | 现有技术职务 | 金额 |
| 张顺平 | 个人类 | 北大 | 男 | 汉族 | 上海市徐家汇区 | 材料工程研究 | 高工 | 2万 | |
| 赵承淑 | 出国类 | 辽大 | 女 | 朝鲜族 | 辽宁省沈阳市 | 农业统计学比较 | 高工 | 4万 | |
… |
示例:基层公司上报业绩,上级公司自动提取报告中的有关内容
示例:第一分公司业绩报告,
|
月份 |
件数 |
面积 |
金额 |
佣金 |
一 |
20 |
2000 |
2000000 |
20000 |
二 |
19 |
1900 |
1900000 |
19000 |
二、房屋租赁
|
件数 |
面积 |
金额 |
佣金 |
一 |
12 |
1200 |
12000 |
1200 |
二 |
11 |
1100 |
11000 |
1100 |
第一分公司
示例:第二分公司业绩报告,Word文档
第二分公司业绩报告
|
|
件数 |
面积 |
金额 |
佣金 |
一 |
10 |
1000 |
100000 |
10000 |
二 |
9 |
900 |
900000 |
9000 |
二、房屋租赁
|
件数 |
面积 |
金额 |
佣金 |
一 |
6 |
600 |
6000 |
600 |
二 |
5 |
500 |
5000 |
500 |
第二分公司
例:用信息提取软件自动生成的销售与租赁统计报表,Excel格式
销售与租赁统计
公司名称 |
销售月份 |
销售件数 |
销售面积 |
销售金额 |
销售佣金 |
租赁件数 |
租赁面积 |
租赁金额 |
租赁佣金 |
第一分公司 |
一 |
20 |
2000 |
2000000 |
20000 |
12 |
1200 |
12000 |
1200 |
第一分公司 |
二 |
19 |
1900 |
1900000 |
19000 |
11 |
1100 |
11000 |
1100 |
第二分公司 |
一 |
10 |
1000 |
100000 |
10000 |
6 |
600 |
6000 |
600/td> |
第二分公司 |
二 |
9 |
900 |
900000 |
9000 |
5 |
500 |
5000 |
500 |
示例:下级报送文件,上级机关自动提取文件中的有关内容
示例:某局和某委文件,Word文档
内蒙古××局文件 内×监发【 2010】11号 ×××××××××××××××××××××××××××××××××× 内蒙古自治区××局 主题词:经济 安全生产 通知 |
内蒙古××委文件 内×计发【 2010】1211号 ×××××××××××××××××××××××××××××××××××××× ××××××××××× 内蒙古自治区×××委员会 主题词:投资 管理 通知 |
示例:用信息提取软件软件自动生成的报送文件目录,Excel格式
报送文件目录
发文机关 |
文件标题 |
发文日期 |
文件字号 |
主题词 |
| 内蒙古自治区××局 | 关于加强安全生产的通知 | 内×监发【2010】11号/td> | 经济 安全生产 通知 | |
| 内蒙古自治区×××委员会 | 关于提高管理水平的通知 | 内×计发【2010】1211号 | 投资 管理 通知 | |