读取大文件时的优化经验

最近在编写一个关于图形学的东西时，由于需要读取模型，写了一个obj文件和mtl文件解析器。实际调试时，由于该文件较长，比如obj文件达到了20万行的量级，在解析时凸显出了各种性能问题，解决这些性能问题的同时，也总结出了一些经验，记录如下：

1 必须使用缓冲区。虽然操作系统实现读取文件应该是有缓冲区概念的，但是结果显示如果不使用缓冲区，而用fgetc挨个字符进行读取，速度会比使用缓冲区慢上1个数量级。因此，引出第一条经验：一切大文件读取必须使用缓冲区，减少fread或fgetc的次数。

2 关于map。vector和map的性能是可以依赖的。虽然debug的时候，插入map的时间总和达到了好几秒的量级，但在release模式下，优化充分的map插入时间变成了几十毫秒，因此可以放心的使用stl的map。

3 关于vector。vector的reserve函数使用以后并不会有特别大的效果，由于vector的内存池优化比较好，实在没有必要在一开始就reserve，因为临时扩展，所耗费的时间甚至小于两次测量的误差。

4 ftell函数也是耗时的！我的某个读取函数一开始调用了ftell，这个函数一直稳定的耗费2.5秒左右时间。我起初并不怀疑ftell，毕竟这个函数怎么看怎么像无io阻塞，o（1）的东西。没想到去掉ftell的调用后这个函数直接缩减到了耗费25毫秒，少了2个量级。因此还是这句话，所有io函数都少用为妙，自己维护缓冲区，指针才是王道。

至于ftell为什么这么慢，我猜想是内部调用了api访问了文件内核对象的缘故

最后经过优化的解析器，读取20万行的obj文件使用740毫秒，不算特别快的速度，不过暂时优化就到此为止了，以后有时间再进一步搞。

时间： 2024-11-04 14:44:39

读取大文件时的优化经验的相关文章

PHP几个快速读取大文件例子

PHP几个快速读取大文件例子感谢把我给崩了的投递时间:2014-10-16 来源:三联在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file.file_get_contents之类的函数,简简单单的几行代码就能很漂亮的完成我们所需要的功能.但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法. 需求有一个800M的日志文件,大约有500多万行, 用PHP返回最后几行的内容. 实现方法 1. 直接采

PHP如何快速读取大文件

原文:PHP如何快速读取大文件在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file.file_get_contents之类的函数,简简单单的几行代码就能很漂亮的完成我们所需要的功能.但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法. 需求需求有一个800M的日志文件,大约有500多万行, 用PHP返回最后几行的内容. 实现方法 1. 直接采用file函数来操作由于 file函数是一次性将所有内容

【转】PHP如何快速读取大文件

在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file.file_get_contents之类的函数,简简单单的几行代码就能很漂亮的完成我们所需要的功能.但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法. 需求需求有一个800M的日志文件,大约有500多万行, 用PHP返回最后几行的内容. 实现方法 1. 直接采用file函数来操作由于 file函数是一次性将所有内容读入内存,而PHP为了防止一些写

php -- 读取大文件

在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file.file_get_contents之类的函数,简简单单的几行代码就能很漂亮的完成我们所需要的功能.但当所操作的文件是一个比较大的文件时,这些函数可能就显的力不从心, 下面将从一个需求入手来说明对于读取大文件时,常用的操作方法. 需求需求有一个800M的日志文件,大约有500多万行, 用PHP返回最后几行的内容. 实现方法1. 直接采用file函数来操作由于 file函数是一次性将所有内容读入内存,而PHP为了防止一些写的比较

3分钟学会，学会用Python正确读取大文件

文件读写属于一种常见的IO操作,由于操作系统将底层操作磁盘的接口向上封装为一种通用接口,因此Python中读写文件的基本方法和JAVA.PHP等高级编程语言一样,先请求操作系统打开一个文件描述符,通过操作系统提供的接口从这个文件对象中读取数据,或者把数据写入这个文件中,最后当文件读写操作完成后关闭文件. 需要注意的是文件读写完成后必须及时关闭文件,一方面打开的文件会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限制的,比如Linux操作系统中我们可以使用ulimit -n命令查看

php使用file函数、fseek函数读取大文件效率分析

php读取大文件可以使用file函数和fseek函数,但是二者之间效率可能存在差异,本文章向大家介绍php file函数与fseek函数实现大文件读取效率对比分析,需要的朋友可以参考一下. 1. 直接采用file函数来操作由于 file函数是一次性将所有内容读入内存,而PHP为了防止一些写的比较糟糕的程序占用太多的内存而导致系统内存不足,使服务器出现宕机,所以默认情况下限制只能最大使用内存16M,这是通过php.ini里的 memory_limit = 16M 来进行设置,这个值如果设置-1,

Java高效读取大文件

1.概述本教程将演示如何用Java高效地读取大文件.这篇文章是Baeldung (http://www.baeldung.com/) 上“Java——回归基础”系列教程的一部分. 2.在内存中读取读取文件行的标准方式是在内存中读取,Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法: Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)); 这种

windows下Perl如何读取大文件的最后一行(总结)

Perl中读取文件最后一行的方法很多,比如 (1)将文件读入数组,取最后一个元素 open (FILE,"file.txt") or die "$!"; my @arr=<FILE>;; close FILE; my $last=$arr[$#arr]; #$last里就是最后一行的内容了. (2)一行一行读入,到最后一行时输出 open (FILE,"file.txt") or die "$!"; while (

Java高效读取大文件（转）

1.概述本教程将演示如何用Java高效地读取大文件.这篇文章是Baeldung(http://www.baeldung.com/) 上“Java——回归基础”系列教程的一部分. 2.在内存中读取读取文件行的标准方式是在内存中读取,Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法: 1 2 3 Files.readLines(new File(path), Charsets.UTF_8); FileUtils.readLines(new File(path)

猜你喜欢

创业的第二十一天

住家里真的挺多事操心的,很多事情都让我分心,有点累. 最近公司的软件被破解了,这款软件是一款PC软件,我们盈利方式是通过操作PC软件时向服务器发起请求,然后扣除积分,积分不够了就向我们购买.最近有个购 ...

HDU 5382 莫比乌斯反演

题目大意: 求S(n)的值 n<=1000000 这是官方题解给出的推导过程,orz,按这上面说的来写,就不难了这里需要思考的就是G(n)这个如何利用积性函数的性质线性筛出来作为一个质数,那 ...

跨域的另一种解决方案CORS（CrossOrigin Resource Sharing）跨域资源共享

在我们日常的项目开发时使用AJAX,传统的Ajax请求只能获取在同一个域名下面的资源,但是HTML5打破了这个限制,允许Ajax发起跨域的请求.浏览器是可以发起跨域请求的,比如你可以外链一个外域的图片 ...

zabbix3.0安装

本次安装准备安装3.0的zabbix(LNMP) 第一步安装zabbix官方的zabbix源,地址如下: http://repo.zabbix.com/zabbix/3.0/rhel/6/x86_ ...

Mac电脑手动清理

Xcode的无用的文件如图找到DerivedData文件夹,删除里面文件就可以了(先找到隐藏的文件)

在本地运行bootstrap-笔记

前言:版本一定要按照教程指定,安装最后,如有错误,请先检查版本-2014-03-05 步骤目录: 安装Ruby:在Windows系统上当然使用rubyinstaller了 1.9.3 下载安装Rub ...

WinOLS肯定比ECM TITANUIM（反馈）更好

很显然,汽车是最好的做WinOLS 如果你有给予,但如果你离开车早在下午安排,并把它传递给在最后一分钟为极限拿起和WinOLS不给那部车.做多久,你必须在地图上搜寻,并尝试识别和程序,直至罚款? 哪个 ...

jquery dropdownlist.js

$.fn.extend({ SetDict: function (option) { var txtControl = $(this); if (!txtControl.hasClass(" ...

三，红叶

回目录:http://www.cnblogs.com/wantnon/p/5002509.html 小明是个小学生.这天他刚一出校门,认出不远处那个男的是他爸,他张开双臂冲进父亲怀里.父亲年八月才回来 ...

【组队训练】2016 CCPC 长春

5题.铜排倒数.[哼,稳定铜牌老规矩,我看K,zr看A,xl看C. A,C都不可做,K我不会,但是感觉也许可以做,于是喊他们看看. 我看J题,感觉可做,就开始写. 过了一会B题过了挺多,zr先写B. ...

第一章 Java简介

1.JDK的安装与配置 (1)直接安装JDK(java开发工具包,内含JRE) (2)配置环境变量:我的电脑——右键属性——高级——环境变量——系统环境变量——path——编辑(将JDK的安装路径配置 ...

PHP-day01

<html><head> <title>day01</title></head><body ...

vc2010下使用64位控件

最近把我的控件(ST_Curve www.st-curve.cn)升级到了64位,2010编译,本来以为很简单的问题,结果折腾了两天(也有可能我多年没做过界面和vc相关的东西了吧),于是把我遇到的问题 ...

poj 2392 Space Elevator DP

该题与poj 1742的思路基本一致:http://www.cnblogs.com/sevenun/p/5442279.html(多重背包) 题意:给你n个电梯,第i个电梯高h[i],数量有c[i]个 ...

SQL Server 的内存分类

第一类. 根据申请方式分: commit 型它是指先reserve申请一大块,再通过commit提交后得到的空间.这种方式申请到的空间可以启用 awe ! stolen型与commit 相对应!它 ...

R生存分析AFT

1. Surv Description 创建一个生存对象,通常用作模型公式中的响应变量. 参数匹配是此功能的特殊功能,请参阅下面的详细信息. Surv(time, time2, event, type ...

Linux 文件上传时无法创建新路径，mkdirs也返回false。

web项目,文件上传到linux服务器时无法创建新路径,java.io.File 不会自动创建路径,手动mkdirs也是返回false,检查了所有代码,没发现问题. 经同事提醒,linux中的tomc ...

性能测试/容量预估思考

1 背景随着业的快速成长,日访问量越来越高,除了对功能要求很高以外,对性能要求也越来越高. 在实际工作中,我们往往会被一些问题所困扰. 1)线上服务容量是多少?性能痛点在哪里? 可伸缩性(resil ...

8亿留人陈天桥的豪迈感情牌

一夜之间成为亿万富翁是什么感受?最近,因受盛大董事长陈天桥一次性赠予的每人1亿元股权,盛大游戏的8位制作人一时成为"游戏圈的亿万富翁".除了1亿豪赠,让更多人感到不可思议的还有素以 ...

HTML Select Option选择后触发jQuery事件代码实例

页面设计原由: 因为很多客户不知道如何来到我们公司,领导想让我在微信公众号上面做一个链接,客户可以直接通过微信公众号打开地图并导航到我们公司的办公地点. 实现起来并不难,但由于公司有很多办事处,所以需 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.