JAVA POI实现大数据量excel文件读写及导出

createh55个月前 (02-01)技术教程35


Apache POI 是一个流行的 Java 库,用于处理 Microsoft Office 文档,包括 Excel。处理大数据量的 Excel 文件时,建议使用 SXSSF (Streaming Usermodel API) 来写数据,因为它可以有效地处理大量数据而不会耗尽内存。

以下是一个简单的示例,展示如何使用 Apache POI 读写大数据量的 Excel 文件,并导出数据:

  1. 添加依赖

首先,确保你的项目中包含了 Apache POI 的依赖。如果你使用 Maven,可以在 pom.xml 中添加以下依赖:

<dependency>  
    <groupId>org.apache.poi</groupId>  
    <artifactId>poi-ooxml</artifactId>  
    <version>5.0.0</version> <!-- 请检查是否有更新的版本 -->  
</dependency>
  1. 读取大数据量的 Excel 文件
public void readLargeExcelFile(String filePath) throws IOException {  
    InputStream is = new FileInputStream(filePath);  
    Workbook workbook = WorkbookFactory.create(is);  
    Sheet sheet = workbook.getSheetAt(0);  
    Iterator<Row> rowIterator = sheet.iterator();  
  
    while (rowIterator.hasNext()) {  
        Row row = rowIterator.next();  
        Iterator<Cell> cellIterator = row.cellIterator();  
  
        while (cellIterator.hasNext()) {  
            Cell cell = cellIterator.next();  
            switch (cell.getCellType()) {  
                case STRING:  
                    System.out.print(cell.getStringCellValue() + "\t");  
                    break;  
                case NUMERIC:  
                    System.out.print(cell.getNumericCellValue() + "\t");  
                    break;  
                // 其他数据类型可以按需处理  
            }  
        }  
        System.out.println("");  
    }  
    workbook.close();  
    is.close();  
}
  1. 写入大数据量的 Excel 文件

使用 SXSSF 来处理大数据量的写入:

public void writeLargeExcelFile(String filePath) throws IOException {  
    Workbook workbook = new SXSSFWorkbook(); // 使用 SXSSF 处理大数据量写入  
    Sheet sheet = workbook.createSheet("Sheet1");  
    int rowCount = 0;  
  
    for (int i = 0; i < 100000; i++) { // 假设有100,000行数据  
        Row row = sheet.createRow(rowCount++);  
        for (int j = 0; j < 10; j++) { // 假设每行有10个单元格  
            Cell cell = row.createCell(j);  
            cell.setCellValue("Data" + i + j);  
        }  
        // 控制内存使用,告诉 SXSSF 在达到一定的行数后刷新到磁盘,释放内存中的行数据  
        if (rowCount % 100 == 0) {  
            ((SXSSFSheet) sheet).flushRows(100); // 保留最后100行在内存中,其他的刷新到磁盘  
        }  
    }  
    FileOutputStream outputStream = new FileOutputStream(filePath);  
    workbook.write(outputStream);  
    workbook.close();  
    outputStream.close();  
}

注意:当处理大数据量的 Excel 文件时,要确保调整 JVM 的内存设置,以提供足够的内存来处理数据。

相关文章

Java高级特性——注解:注解实现Excel导出功能

注解是 Java 的一个高级特性,Spring 更是以注解为基础,发展出一套“注解驱动编程”。这听起来高大上,但毕竟是框架的事,我们也能用好注解吗?的确,我们很少有机会自己写注解,导致我们搞不清楚注解...

Android 读写文件(安卓开发读写文件)

Android使用一个非常类似与其他平台上的基于磁盘的文件系统. 这节课讲述如何利用File APIs在Android文件系统中读写文件.File 对象非常适合于流式顺序数据的读写. 如图片文件或是网...

package-info.java 的使用(package java.util)

package-info.java 介绍pacakge-info.java 是一个 Java 文件,目标是提供一个包级的文档说明及包级的注释。在 Java 5 之前,包级的文档是 package.ht...

Java原生代码实现爬虫(爬取小说)(java开源爬虫平台)

Java也能做爬虫。现在提到爬虫人第一个想到的就是python,其实使用Java编写爬虫也是很好的选择,Java成熟的爬虫框架很多,下面给大家展示一个使用Java基础语言编写的爬取小说的案例:实现功能...

这份日志格式规范超棒的,拿走不谢(Java版)

1 简介在程序中写日志是一件非常重要,但是很容易被开发人员忽视的地方。写好程序的日志可以帮助我们大大减轻后期维护压力。在实际的工作中,开发人员往往迫于巨大时间压力,而写日志又是一个非常繁琐的事情,往往...

进大厂必备的Java八股文大全(2022最强精简易懂版)

2022年秋招即将来临,很多同学会问Java面试八股文有必要背吗?答案是,必须背,博主是个三本,今年凭借这篇八股文斩获了多个大厂暑期实习offer,相信秋招一定也可以发挥重要作用。你可以讨厌这种模式,...