前言:
有时系统中需要提取各种文件中的数据,比如做报表的系统中就常常与Excel表格数据做交互。做Excel报表数据时有选择POI实现的,但是POI功能也很单一,对于文档格式维护性差,最重要的是POI在操作word数据时显得力不从心,所以对于word中数据的交互就要找找其他方式。其实对于文档的操作,微软有自己的一套东西——activex控件。
但是这需要开发者具备将activex控件集成到Java环境的能力。对于大部分Java开发工程师来说,仅仅解决单一的功能就要掌握activex控件,未免学习成本太大。
所以我们今天就要介绍一个中间件技术——pageoffice,此中间件技术已经将 在web系统操作office文档的大部分功能整合完毕,大家只需要关注自己web系统的业务逻辑即可,学习成本低,且功能很丰富。下面我们来实战用pageoffice实现一下用Java从word文档的表格中提取数据的功能。
先看效果:
打开的文档中有下面这么一个表格
点击保存,弹出了如下窗口,窗口中是word表格中的数据。这里只是为了演示,其实这些数据是在后台中拿到后然后又输出到页面中的,实际开发中拿到数据可以保存到数据库的。
部署步骤(只需5步)
1.官网http://www.zhuozhengsoft.com/dowm/下载集成文件,引入jar包,配置web.xml
去刚才下载的集成文件中找到lib,将里面的内容放在项目web-inf的lib中引入jar包,然后将web.xml的pageoffice配置引入到自己项目的wb.xml中
2.在父页面aaa.jsp(需要打开文档的页面)放一个a标签或者button
写a标签之前先引入pageoffice需要的js文件
<script type="text/javascript" src="/jquery.min.js"></script>
<script type="text/javascript" src="/pageoffice.js" id="po_js_main"></script>
然后添加a标签
<a href="javascript:POBrowser.openWindowModeless('Default.jsp' , 'width=1200px;height=800px;');">获取Word文件中表格的数据</a>
3.在父页面同级目录下创建一个名为Default.jsp的文件
<%@ page language="java" import="java.util.*, java.awt.*" pageEncoding="utf-8"%>
<%@page import="com.zhuozhengsoft.pageoffice.*, com.zhuozhengsoft.pageoffice.wordwriter.*"%>
<%
//***************************卓正PageOffice组件的使用********************************WordDocument doc = new WordDocument();//打开数据区域DataRegion dTable = doc.openDataRegion("PO_table");//设置数据区域可编辑性dTable.setEditing(true);//打开数据区域中的表格,OpenTable(index)方法中的index为word文档中表格的下标,从1开始Table table1 = dTable .openTable(1);//设置表格边框样式table1.getBorder().setLineColor(Color.green);table1.getBorder().setLineWidth(WdLineWidth.wdLineWidth050pt);// 设置表头单元格文本居中table1.openCellRC(1, 2).getParagraphFormat().setAlignment(WdParagraphAlignment.wdAlignParagraphCenter);table1.openCellRC(1, 3).getParagraphFormat().setAlignment(WdParagraphAlignment.wdAlignParagraphCenter);table1.openCellRC(2, 1).getParagraphFormat().setAlignment(WdParagraphAlignment.wdAlignParagraphCenter);table1.openCellRC(3, 1).getParagraphFormat().setAlignment(WdParagraphAlignment.wdAlignParagraphCenter);// 给表头单元格赋值table1.openCellRC(1, 2).setValue("产品1");table1.openCellRC(1, 3).setValue("产品2");table1.openCellRC(2, 1).setValue("A部门");table1.openCellRC(3, 1).setValue("B部门");PageOfficeCtrl poCtrl = new PageOfficeCtrl(request);poCtrl.setWriter(doc);//添加自定义按钮poCtrl.addCustomToolButton("保存", "Save", 1);poCtrl.addCustomToolButton("全屏/还原", "IsFullScreen", 4);//设置服务器页面poCtrl.setServerPage(request.getContextPath()+"/poserver.zz"); //此行必须//设置保存页poCtrl.setSaveDataPage("SaveData.jsp");//设置文档打开方式poCtrl.webOpen("test.doc", OpenModeType.docSubmitForm, "张佚名");
%><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head><meta http-equiv="Content-Type" content="text/html; charset=gb2312" /><title>数据区域提交表格</title><link href="images/csstg.css" rel="stylesheet" type="text/css" /></head>
<body><div id="content"><div id="textcontent" style="width: 1000px; height: 800px;"><script type="text/javascript">//保存页面function Save() {document.getElementById("PageOfficeCtrl1").WebSave();}//全屏/还原function IsFullScreen() {document.getElementById("PageOfficeCtrl1").FullScreen = !document.getElementById("PageOfficeCtrl1").FullScreen;}</script><!--************** 卓正 PageOffice组件 ************************--><%=poCtrl.getHtmlCode("PageOfficeCtrl1")%></div></div></body>
</html>
4.新建文件
新建一个名为test.doc的word文件(如果新建的是docx文件就将第三步的poCtrl.webOpen("test.doc", OpenModeType.docSubmitForm, "张佚名");代码改为poCtrl.webOpen("test.docx", OpenModeType.docSubmitForm, "张佚名");
将新建的test.doc文件放在Default.jsp同级目录下。
本地打开test.doc文件,创建一个3行3列的表格,然后点击表格左上角的全选标志选中整个表格。
在整个表格选中的情况下,点击菜单栏插入-书签--书签名设置为PO_table--点击添加(书签名称格式为PO_开头,比如自己设置的书签名为PO_T001,那么记得将第三步中的 DataRegion dTable = doc.openDataRegion("PO_table");改为 DataRegion dTable = doc.openDataRegion("PO_T001");)。
5.在父页面同级目录下创建一个名为SaveData.jsp的文件
<%@ page language="java"import="java.util.*,com.zhuozhengsoft.pageoffice.*,com.zhuozhengsoft.pageoffice.wordreader.*"pageEncoding="utf-8"%>
<%//----------- PageOffice 服务器端编程开始 -------------------//WordDocument doc = new WordDocument(request,response);DataRegion dataReg = doc.openDataRegion("PO_table");Table table = dataReg.openTable(1);//输出提交的table中的数据out.print("表格中的各个单元的格数据为:<br/><br/>");StringBuilder dataStr = new StringBuilder();for (int i = 1; i <= table.getRowsCount(); i++){dataStr.append("<div style='width:220px;'>");for (int j = 1; j <= table.getColumnsCount(); j++){dataStr.append("<div style='float:left;width:70px;border:1px solid red;'>"+table.openCellRC(i,j).getValue()+"</div>");}dataStr.append("</div>");}out.print(dataStr.toString());//向客户端显示提交的数据doc.showPage(300, 300);doc.close();
%><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title>My JSP 'SaveFile.jsp' starting page</title><meta http-equiv="pragma" content="no-cache"><meta http-equiv="cache-control" content="no-cache"><meta http-equiv="expires" content="0"><meta http-equiv="keywords" content="keyword1,keyword2,keyword3"><meta http-equiv="description" content="This is my page"><!--<link rel="stylesheet" type="text/css" href="styles.css">--></head><body></body>
</html>
(如果自己设置的书签名为PO_T001,记得将上面的DataRegion dataReg = doc.openDataRegion("PO_table");改为 DataRegion dataReg = doc.openDataRegion("PO_T001");)。
然后启动项目直接访问aaa.jsp点击链接.此时会提示安装插件,点击安装成功后提示注册,填写相关信息,填写注册码Q37LN-W8NI-KFSQ-LEY3Y就可以打开文档.
注意:如果需要更丰富的功能,可以去pageoffice官网下载示例代码直接将samples4文件夹拷贝到Tomcat的webapps下,启动Tomcat,浏览器访问http://localhost:8080/Samples4/index.html,查看示例中的下面一个链接,直接看samples4文件夹下DataRegionTable文件夹里面的代码.
刚开始接触pageoffice的话,也可以看视频快速上手http://www.zhuozhengsoft.com/Technical/
如有侵权,请联系博主