C++开发的Redis数据导入工具优化

易采站长站为您分析C++开发的Redis数据导入工具优化方法的相关资料,需要的朋友可以参考下

背景

使用C++开发了一个Redis数据导入工具
从oracle中将所有表数据导入到redis中；
不是单纯的数据导入，每条oracle中的原有记录，需要经过业务逻辑处理，
并添加索引（redis集合）；
工具完成后，性能是个瓶颈；

优化效果

使用了2个样本数据测试：
样本数据a表8763 条记录；
b表940279 条记录；

优化前，a表耗时11.417s；
优化后，a表耗时1.883s；

用到的工具

gprof, pstrace,time

使用time工具查看每次执行的耗时，分别包含用户时间和系统时间；
使用pstrace打印实时运行，查询进程主要的系统调用，发现耗时点；
使用gprof统计程序的耗时汇总，集中精力优化最耗时的地方；

使用简介：

1.对g++的所有编辑和连接选项都必须要加上-pg（第一天由于没有在连接处加上-pg选项，导致无法出统计报告）；
2.执行完程序后，本目录会产生gmon.out文件；
3.gprof redistool gmou.out > report,生成可读文件report，打开report集中优化最耗时的函数；

优化过程

优化前11.417s：

复制代码
time ./redistool im a a.csv
real    0m11.417s
user    0m6.035s
sys     0m4.782s （发现系统调用时间过长）

文件内存映射

系统调用时间过长，主要是文件读写，初步考虑是读取文件时，调用api次数过于频繁；
读取样本采用的是文件fgets一行行的读取，采用文件内存映射mmap后，可直接使用指针操作整个文件内存快；

日志开关提前

改进了文件读写后，发现优化效果比较有限（提高了2s左右）；fgets是C的文件读取库函数，相比系统read()，是带了缓冲区了，应该不会太慢（网上有人测试，文件内存映射相比fgets()能快上一个数量级，感觉场景应该比较特殊）；

1/3 1 2 3 下一页尾页

C++开发的Redis数据导入工具优化

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码