C++开发的Redis数据导入工具优化

2020-01-06 13:06:45王振洲
易采站长站为您分析C++开发的Redis数据导入工具优化方法的相关资料,需要的朋友可以参考下    

背景

使用C++开发了一个Redis数据导入工具 
从oracle中将所有表数据导入到redis中; 
不是单纯的数据导入,每条oracle中的原有记录,需要经过业务逻辑处理, 
并添加索引(redis集合); 
工具完成后,性能是个瓶颈;

优化效果

使用了2个样本数据测试: 
样本数据a表8763 条记录; 
b表940279 条记录;

优化前,a表耗时11.417s; 
优化后,a表耗时1.883s;

用到的工具

gprof, pstrace,time

使用time工具查看每次执行的耗时,分别包含用户时间和系统时间; 
使用pstrace打印实时运行,查询进程主要的系统调用,发现耗时点; 
使用gprof统计程序的耗时汇总,集中精力优化最耗时的地方; 

使用简介: 

1.对g++的所有编辑和连接选项都必须要加上-pg(第一天由于没有在连接处加上-pg选项,导致无法出统计报告); 
2.执行完程序后,本目录会产生gmon.out文件; 
3.gprof redistool gmou.out > report,生成可读文件report,打开report集中优化最耗时的函数;

优化过程

优化前11.417s:

 

复制代码
time ./redistool im a a.csv
real    0m11.417s
user    0m6.035s
sys     0m4.782s (发现系统调用时间过长)

 

文件内存映射

系统调用时间过长,主要是文件读写,初步考虑是读取文件时,调用api次数过于频繁; 
读取样本采用的是文件fgets一行行的读取,采用文件内存映射mmap后,可直接使用指针操作整个文件内存快;

日志开关提前

改进了文件读写后,发现优化效果比较有限(提高了2s左右);fgets是C的文件读取库函数,相比系统read(),是带了缓冲区了,应该不会太慢(网上有人测试,文件内存映射相比fgets()能快上一个数量级,感觉场景应该比较特殊);