网站首页 > 技术文章 正文
优化百万数据导出Excel。
大量数据导出excel存在的问题以及优化方案。
·问题一:一次性获取全部数据到内存当中容易引起系统的Excel,这里的解决方案是分页查询、分批处理。
·问题二:分页查询存在深度分页问题,数据偏移量变大会导致Excel变慢。这里有两种解决方案:
→一种是使用标签记录优化,这里就采用这种方案,因为ID是自增且连续的,还有一种方案是索引覆盖优化。之前视频有讲过,有兴趣的小伙伴可以去看一下。
→问题三:查询数据串行,这里可以通过线程编排并行执行sql,最后顺序导入到Excel当中。
→问题四:一个Excel文件过大,用户可能存在打不开的情况。这里通过easyexcel多sheet页导出数据,这里有一张user表,里面有100万条数据。接下来看一眼代码示例。首先看一下单线程的导出,这里设置一下响应结果,查询导出数据总数,每个sheet页是10万条数据。
接下来通过MybatisPlus进行分页查询,然后通过EasyExcel直接导出这些数据就可以了,还是比较简单的。
接下来看一下多线程的方法,同样设置响应结果、查询总数量,然后每个sheet页是10万条数据。这里创建了一个completableFuture的集合。接下来调用completableFuture的runAsync方法,然后异步去查询数据库。
这里有个优化的点就是分页,每次分页都会传入上次查询的最大ID,用于优化深度分页问题。这里有一点需要注意,查询是并行的,但是写入sheet页需要同步执行,否则会抛出异常。最后就是等待所有线程执行完毕,关闭流通。
过日志可以看到单线程导出是需要38秒,多线程是28秒,优化了10秒钟。来看一下数据,这一共有10个sheet页,每个sheet页都是10万条数据。
最后小伙伴们还有什么更好的办法吗?评论区讨论一下。点点关注!
猜你喜欢
- 2024-10-16 MySQL 使用 limit 分页会导致数据丢失、重复和索引失效
- 2024-10-16 elasticsearch 分页查询 search_after 深分页
- 2024-10-16 SpringBoot整合oceanbase,实现oracle无缝切换到oceanbase
- 2024-10-16 Mongodb 分页查询与排序查询 mongodb排序查询sort
- 2024-10-16 MVC模式下用Servlet和jsp分页的HelloWord
- 2024-10-16 elasticsearch 分页查询scroll 深分页
- 2024-10-16 京东终面:ElasticSearch深度分页如何优化?
- 2024-10-16 spring boot封装通用的查询+分页接口
- 2024-10-16 Elasticsearch 分页查询 from + size 浅分页
- 2024-10-16 Java 拆分PDF页面 java中分页实现步骤图解
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)