信息提取软件简介

信息提取软件


笊篱指一种做饭用的工具,象勺子,有眼儿,主要实现烹饪过程中食品与油、汤分离。在处理Word文档时我们也希望有一个笊篱一样的工具,把我们想要的内容过滤出来。


信息提取软件就是一个像笊篱一样的工具软件,能批量读取 Word文档中指定内容,并把指定内容转到Excel文档中的软件。当工作中需要重复地把Word文档的部分内容复制粘贴到新的表格中时,信息提取软件就能代替您工作。如何购买

使用信息提取软件有两个方法,用户购买信息提取软件,自己提取Word文档中的信息,或委托元泰数据管理公司提取信息。用户还可以免费在线提取Word文档内容,可前住体验。操作指导

要使用在线提取功能,您的电脑需要具备下面的运行环境:

一、.net Framework 2.0

二、浏览器允许下载未经签名的ActiveX控件

了解运行环境的设置

三、下载安装文件,安装提取软件。下载

如果您的电脑具备了上述环境,可直接体验提取软件。直接体验提取软件,每次只能提取一份文件的内容,每天限提取10次

有了体验后,您要是想经常使用信息提取软件,您可以向元泰公司购买该软件在网上的使用服务。长期使用的方法

用途

大学图书馆接收学生递交的毕业论文后,用信息提取软件建论文索引

政府机关接到其他机关单位报送的申请表后,用信息提取软件生成花名册、一览表

大的区域性公司收到下面公司报送的报表后,用信息提取软件生成新的统计报表

政府机关在报送政府公开信息时,使用信息提取软件自动生成政府公开信息报送目录


使用实例

某人事管理机关负责审查报送的人才培养经费申请表,在经专家审核后,发放相关经费。报送的材料一般为纸质和电子的两套。为准备专家评审会,机关业务人员需要编制一份包含所有申请人的花名册。一般情况下,具体工作人员要打开一份份的电子版的申请表,从中摘出申请人的姓名、性别、学历、工作单位、培养内容、申请人所在省市自治区等内容,制成花名册,供评审组专家在会上使用。工作人员需要不停地复制、粘贴,处理一份申请表需要花费 3-5分钟时间,如果该人事管理机关需要处理100个这样的申请表,可能需要一天的时间。这项工作需要精力集中,如果工作人员在处理申请表时还要接电话和其他业务,更要很长时间才能完成。如果使用信息提取软件来处理,几分钟就处理完了,软件可自动生成一个Excel格式的花名册,供上会使用。

大学图书馆需要接收毕业生的毕业论文,建论文索引,供今后检索使用。但每年几千论文的录入工作量让人却步,使用信息提取软件后可轻松完成这项工作。大学图书馆可设 论文接收入口,如邮箱或FTP上传窗口。在接收学生上传的论文后,可使用信息提取软件自动生成论文目录。
下级公司定期撰写 Word格式的业绩报告,内含有关业绩的统计数字,上级公司需要收集这些数字,生成Excel格式的报表,进行进一步的统计分析。在手工收集的情况下,需要工作人员分别打开每一个业绩报告,将其内容复制到新的表格中,不停地调整格式,耗时费力才能完成任务。用信息提取软件就可以自动完成相关内容的提取任务。

按《政府公开信息条例》的要求,各机关要向档案馆、图书馆等政府公开信息阅览场所报送要公开的文件。档案馆和其他接收单位在接收信息后要为这些信息做目录,以便今后检索。当接收的文件很多的时候,这录入工作量会很大。用信息提取软件可以自动对接收的电子版的文档进行处理,生成机读目录。
要想正确使用信息提取软件,还需要使用嵌入 XML标记的文档模板。这样的文档模板可自己设计,也可委托给元泰公司完成。

示例:大学图书馆把一份份的毕业论文相关内容提取出来,生成论文索引

示例:两份学生论文,Word文档

基于元数据的信息交换


赵小玲

 

学院名称:计算机学院

专业:电子商务

年级: 2006

指导教师:赵喜才

日期: 2010.6.10

XML在文件管理上的应用


哈斯朝鲁

 

学院名称:计算机学院

专业:软件工程

年级: 2005

指导教师: 斯勤图

日期: 2009.6.10


示例:用信息提取软件自动生成的论文索引,Excel格式

论文索引

学生姓名 论文题目 学院名称 专业 年级 指导教师 日期
赵小玲 基于元数据的信息交换 计算机学院 电子商务 2006 赵喜才 2010.8
哈斯朝鲁 XML在文件管理上的应用 计算机学院 软件工程 2005 斯勤图 2009.8

           

示例:政府机关把一份份的申请表内容提取出来,生成花名册。下面是两个申请表,

经费申请表

姓名

张顺平

申请类别

人类

毕业院校

北大

 

 相 片

性别

民族

汉族

身份证/护照号

191010101
010101010

出生日期

1977-11-22

出生地

上海市徐家汇区

申请项目

材料工程研究

现有技术职务

高工

金额

2

 

 

经费申请表

姓名

赵承淑

申请类别

出国类

毕业院校

辽大

性别

民族

朝鲜族

身份证/护照号

111010101
010101020

出生日期

1978-12-01

出生地

辽宁省沈阳市

申请项目

农业统计学比较

现有技术职务

高工

金额

4


过去办理这些申请表时,都是手工复制每个项目的内容,再粘贴到花名册的相应位置中。一会儿按鼠标在Word和Excel中切换,一会儿按键盘复制、粘贴,劳心、费眼,一天下来,吃饭的力气也没有了。为什么不用信息提取软件来自动处理呢?

使用信息提取软件自动提取相关内容生成的花名册

花名册

姓名 申请类别 毕业院校 性别 民族 出生日期 出生地 申请项目 现有技术职务 金额
张顺平 个人类 北大 汉族 1977-11-22

上海市徐家汇区 材料工程研究 高工 2
赵承淑 出国类 辽大 朝鲜族 1978-12-01

辽宁省沈阳市 农业统计学比较 高工 4

                 

示例:基层公司上报业绩,上级公司自动提取报告中的有关内容

示例:第一分公司业绩报告,


第一分公司业绩报告

总公司:
经过全体员工的努力,我分公司各项业务均取得明显进展。现将本分公司 2010年元月1日至2月28日的房屋销售和房屋租赁情况汇报如下:

一、房屋销售

月份

件数

面积

金额

佣金

20

2000

2000000

20000

19

1900

1900000

19000

二、房屋租赁


月份

件数

面积

金额

佣金

12

1200

12000

1200

11

1100

11000

1100

第一分公司

示例:第二分公司业绩报告,Word文档

 

第二分公司业绩报告

总公司:
经过三个月的努力,我分公司各项业务均取得明显进展。现将本分公司 2010年元月1日至 2月28日的房屋销售和房屋租赁情况 汇报如下:

一、房屋销售


月份

件数

面积

金额

佣金

10

1000

100000

10000

9

900

900000

9000

二、房屋租赁


月份

件数

面积

金额

佣金

6

600

6000

600

5

500

5000

500

第二分公司

例:用信息提取软件自动生成的销售与租赁统计报表,Excel格式

销售与租赁统计

公司名称

销售月份

销售件数

销售面积

销售金额

销售佣金

租赁件数

租赁面积

租赁金额

租赁佣金

第一分公司
20
2000
2000000
20000
12
1200
12000
1200
第一分公司
19
1900
1900000
19000
11
1100
11000
1100
第二分公司
10
1000
100000
10000
6
600
6000
600/td>
第二分公司
9
900
900000
9000
5
500
5000
500

示例:下级报送文件,上级机关自动提取文件中的有关内容

示例:某局和某委文件,Word文档

 

内蒙古××局文件

内×监发【 201011
--------------------
---------------------
关于加强安全生产的通知
各部、委、办、厅、局:
××××××××××××××××××××××××××××××××××××××××××

××××××××××××××××××××××××××××××××××

内蒙古自治区××局
2010年9月5日

主题词:经济 安全生产 通知

 

 

内蒙古××委文件

内×计发【 2010】1211
--------------------
---------------------
关于提高管理水平的通知
各部、委、办、厅、局:
××××××××××××××××××××××××××

××××××××××××××××××××××××××××××××××××××

×××××××××××

内蒙古自治区×××委员会
2010年8月12日

主题词:投资 管理 通知

示例:用信息提取软件软件自动生成的报送文件目录,Excel格式

报送文件目录

发文机关

文件标题

发文日期

文件字号

主题词

内蒙古自治区××局 关于加强安全生产的通知 201095 内×监发【201011号/td> 经济 安全生产 通知
内蒙古自治区×××委员会 关于提高管理水平的通知 20108月12日 内×计发【2010】1211 投资 管理 通知
         

 


蒙ICP备11000962号网站备案