欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Excel(大)文件写入03版本和07版本(HSSF-XSSF-SXSSF)

程序员文章站 2022-07-13 15:54:42
...

什么是POI ?

Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。

  • HSSF - 提供读写Microsoft Excel格式档案的功能。(.xls)

  • XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。(.xlsx)

  • HWPF - 提供读写Microsoft Word格式档案的功能。

  • HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

  • HDGF - 提供读写Microsoft Visio格式档案的功能。

一、创建项目

1、创建一个的maven项目

2、pom中引入xml相关依赖

<dependencies>
    <!--xls(03)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>3.9</version>
    </dependency>
    <!--xlsx(07)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>3.9</version>
    </dependency>
    
    <!--日期格式化工具-->
    <dependency>
        <groupId>joda-time</groupId>
        <artifactId>joda-time</artifactId>
        <version>2.10.1</version>
    </dependency>
    <!--test-->
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
</dependencies>

二、xls写-03和07的区别

1.创建时new的对象不一样
Workbook workbook = new HSSFWorkbook();         //03
Workbook workbook = new XSSFWorkbook();         //07

2.生成的文件后缀不一样
FileOutputStream out = new FileOutputStream("d:/test-write03.xls");
FileOutputStream out = new FileOutputStream("d:/test-write07.xlsx");

3.创建时加的前缀不一样(也可以不用加前缀,直接使用接口的方式创建)
HSSFSheet sheet = workbook.createSheet("会员统计");
HSSFRow row1 = sheet.createRow(0);
HSSFCell cell21 = row2.createCell(0);

XSSFSheet sheet = workbook.createSheet("会员统计");
XSSFRow row1 = sheet.createRow(0);
XSSFCell cell21 = row2.createCell(0);

1、03

@Test
public void testWrite03() throws IOException {
    // 创建新的Excel 工作簿
    Workbook workbook = new HSSFWorkbook();
    // 在Excel工作簿中建一工作表,其名为缺省值 Sheet0
    //Sheet sheet = workbook.createSheet();
    // 如要新建一名为"会员登录统计"的工作表,其语句为:
    Sheet sheet = workbook.createSheet("会员统计");
    // 创建行(row 1)
    Row row1 = sheet.createRow(0);
    // 创建单元格(col 1-1)
    Cell cell11 = row1.createCell(0);
    cell11.setCellValue("今日人数");
    // 创建单元格(col 1-2)
    Cell cell12 = row1.createCell(1);
    cell12.setCellValue(666);
    // 创建行(row 2)
    Row row2 = sheet.createRow(1);
    // 创建单元格(col 2-1)
    Cell cell21 = row2.createCell(0);
    cell21.setCellValue("统计时间");
    //创建单元格(第三列)
    Cell cell22 = row2.createCell(1);
    String dateTime = new DateTime().toString("yyyy-MM-dd HH:mm:ss");
    cell22.setCellValue(dateTime);
    // 新建一输出文件流(注意:要先创建文件夹)
    FileOutputStream out = new FileOutputStream("d:/test-write03.xls");
    // 把相应的Excel 工作簿存盘
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();
    System.out.println("03文件生成成功");
}

2 、07

@Test
public void testWrite07() throws IOException {
    // 创建新的Excel 工作簿
    Workbook workbook = new XSSFWorkbook();
    // 在Excel工作簿中建一工作表,其名为缺省值 Sheet0
    //Sheet sheet = workbook.createSheet();
    // 如要新建一名为"会员登录统计"的工作表,其语句为:
    Sheet sheet = workbook.createSheet("会员统计");
    // 创建行(row 1)
    Row row1 = sheet.createRow(0);
    // 创建单元格(col 1-1)
    Cell cell11 = row1.createCell(0);
    cell11.setCellValue("今日人数");
    // 创建单元格(col 1-2)
    Cell cell12 = row1.createCell(1);
    cell12.setCellValue(666);
    // 创建行(row 2)
    Row row2 = sheet.createRow(1);
    // 创建单元格(col 2-1)
    Cell cell21 = row2.createCell(0);
    cell21.setCellValue("统计时间");
    //创建单元格(第三列)
    Cell cell22 = row2.createCell(1);
    String dateTime = new DateTime().toString("yyyy-MM-dd HH:mm:ss");
    cell22.setCellValue(dateTime);
    // 新建一输出文件流(注意:要先创建文件夹)
    FileOutputStream out = new FileOutputStream("d:/test-write07.xlsx");
    // 把相应的Excel 工作簿存盘
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();
    System.out.println("07文件生成成功");
}

三、大文件写的情况下-HSSF、XSSF和SXSSF的区别

 
HSSF
XSSF
SXSSF
耗时
3.199
11.139
2.943
                                                                 (在写入65536行数据时的对比

1、使用HSSF

缺点:最多只能处理65536行,否则会抛出异常

java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

/**
* 03大文件写入测试
* @throws IOException
*/
@Test
public void testWrite03BigData() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();
    //创建一个SXSSFWorkbook
    Workbook workbook = new HSSFWorkbook();
    //创建一个sheet
    Sheet sheet = workbook.createSheet();
    //xls文件最大支持65536行
    for (int rowNum = 0; rowNum < 65536; rowNum++) {
        //创建一个行
        Row row = sheet.createRow(rowNum);
        for (int cellNum = 0; cellNum < 10; cellNum++) {//创建单元格
            Cell cell = row.createCell(cellNum);
            cell.setCellValue(cellNum);
        }
    }
    System.out.println("done");
    FileOutputStream out = new FileOutputStream("d:/test-write03-bigdata.xls");
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();
    //记录结束时间
    long end = System.currentTimeMillis();
    System.out.println("消耗时间:");
    System.out.println((double)(end - begin)/1000);
}


消耗时间:
3.199

2、使用XSSF

缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条

优点:可以写较大的数据量,如20万条

/**
* 07大文件写入测试
* @throws IOException
*/
@Test
public void testWrite07BigData() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();
    //创建一个SXSSFWorkbook
    Workbook workbook = new XSSFWorkbook();
    //创建一个sheet
    Sheet sheet = workbook.createSheet();
    //xls文件最大支持65536行
    for (int rowNum = 0; rowNum < 65536; rowNum++) {
        //创建一个行
        Row row = sheet.createRow(rowNum);
        for (int cellNum = 0; cellNum < 10; cellNum++) {//创建单元格
            Cell cell = row.createCell(cellNum);
            cell.setCellValue(cellNum);
        }
    }
    System.out.println("done");
    FileOutputStream out = new FileOutputStream("d:/test-write07-bigdata.xlsx");
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();
    //记录结束时间
    long end = System.currentTimeMillis();
    System.out.println("消耗时间:");
    System.out.println((double)(end - begin)/1000);
}

消耗时间:
11.139

3、使用SXSSF

优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存

注意:

过程中会产生临时文件,需要清理临时文件

默认由100条记录被保存在内存中,如果查过这数量,则最前面的数据被写入临时文件

如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

文件后缀 .xlsx

/**
* SXSSF写入测试
* @throws IOException
*/
@Test
public void testWrite07BigDataFast() throws IOException {
    //记录开始时间
    long begin = System.currentTimeMillis();
    //创建一个SXSSFWorkbook
    Workbook workbook = new SXSSFWorkbook();
    //创建一个sheet
    Sheet sheet = workbook.createSheet();
    for (int rowNum = 0; rowNum < 65536; rowNum++) {
        //创建一个行
        Row row = sheet.createRow(rowNum);
        for (int cellNum = 0; cellNum < 10; cellNum++) {//创建单元格
            Cell cell = row.createCell(cellNum);
            cell.setCellValue(cellNum);
        }
    }
    FileOutputStream out = new FileOutputStream("d:/test-write07-bigdata-fast.xlsx");
    workbook.write(out);
    // 操作结束,关闭文件
    out.close();
    //清除临时文件
    ((SXSSFWorkbook)workbook).dispose();
    //记录结束时间
    long end = System.currentTimeMillis();
    System.out.println("消耗时间:");
    System.out.println((double)(end - begin)/1000);
}

消耗时间:
2.943

SXSSFWorkbook-来自官方的解释:实现“BigGridDemo”策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。

请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注释......仍然只存储在内存中,因此如果广泛使用,可能需要大量内存。

相关标签: Java