PHP 编程中 10 个最常见的错误,你犯过几个?

错误1:foreach循环后留下悬挂指针 在foreach循环中,如果我们需要更改迭代的元素或是为了提高效率,运用引用是一个好办法: $arr = array(1,2,3,4); foreach($arr as&$value){    $value = $value *2; } // $arr is now array(2, 4, 6, 8) 这里有个问题很多人会迷糊。

错误1:foreach循环后留下悬挂指针

在foreach循环中,如果我们需要更改迭代的元素或是为了提高效率,运用引用是一个好办法:

$arr=array(1,2,3,4);

foreach($arras&$value){

$value=$value*2;

}

// $arr is now array(2, 4, 6, 8)

这里有个问题很多人会迷糊。循环结束后,$value并未销毁,$value其实是数组中最后一个元素的引用,这样在后续对$value的使用中,如果不知道这一点,会引发一些莫名奇妙的错误:)看看下面这段代码:

$array=[1,2,3];

echoimplode(‘,‘,$array),"\n";

foreach($arrayas&$value){}// by reference

echoimplode(‘,‘,$array),"\n";

foreach($arrayas$value){}// by value (i.e., copy)

echoimplode(‘,‘,$array),"\n";

上面代码的运行结果如下:

1,2,3

1,2,3

1,2,2

你猜对了吗?为什么是这个结果呢?

我们来分析下。第一个循环过后,$value是数组中最后一个元素的引用。第二个循环开始:

第一步:复制$arr[0]到$value(注意此时$value是$arr[2]的引用),这时数组变成[1,2,1]

第二步:复制$arr[1]到$value,这时数组变成[1,2,2]

第三步:复制$arr[2]到$value,这时数组变成[1,2,2]

综上,最终结果就是1,2,2

避免这种错误最好的办法就是在循环后立即用unset函数销毁变量:

$arr=array(1,2,3,4);

foreach($arras&$value){

$value=$value*2;

}

unset($value);// $value no longer references $arr[3]

错误2:对isset()函数行为的错误理解

对于isset()函数,变量不存在时会返回false,变量值为null时也会返回false。这种行为很容易把人弄迷糊。。。看下面的代码:

$data=fetchRecordFromStorage($storage,$identifier);

if(!isset($data[‘keyShouldBeSet‘]){

// do something here if ‘keyShouldBeSet‘ is not set

}

写这段代码的人本意可能是如果$data[‘keyShouldBeSet’]未设置,则执行对应逻辑。但问题在于即使$data[‘keyShouldBeSet’]已设置,但设置的值为null,还是会执行对应的逻辑,这就不符合代码的本意了。

下面是另外一个例子:

if($_POST[‘active‘]){

$postData=extractSomething($_POST);

}

// ...

if(!isset($postData)){

echo‘post not active‘;

}

上 面的代码假设$_POST[‘active’]为真,那么$postData应该被设置,因此isset($postData)会返回true。反之,上 面代码假设isset($postData)返回false的唯一途径就是$_POST[‘active’]也返回false。

真是这样吗?当然不是!

即使$_POST[‘active’]返回true,$postData也有可能被设置为null,这时isset($postData)就会返回false。这就不符合代码的本意了。

如果上面代码的本意仅是检测$_POST[‘active’]是否为真,下面这样实现会更好:

if($_POST[‘active‘]){

$postData=extractSomething($_POST);

}

// ...

if($_POST[‘active‘]){

echo‘post not active‘;

}

判断一个变量是否真正被设置(区分未设置和设置值为null),array_key_exists()函数或许更好。重构上面的第一个例子,如下:

$data=fetchRecordFromStorage($storage,$identifier);

if(!array_key_exists(‘keyShouldBeSet‘,$data)){

// do this if ‘keyShouldBeSet‘ isn‘t set

}

另外,结合get_defined_vars()函数,我们可以更加可靠的检测变量在当前作用域内是否被设置:

if(array_key_exists(‘varShouldBeSet‘,get_defined_vars())){

// variable $varShouldBeSet exists in current scope

}

错误3:混淆返回值和返回引用

考虑下面的代码:

classConfig

{

private$values=[];

publicfunction getValues(){

return$this->values;

}

}

$config=newConfig();

$config->getValues()[‘test‘]=‘test‘;

echo$config->getValues()[‘test‘];

运行上面的代码,将会输出下面的内容:

PHPNotice:Undefinedindex:testin/path/to/my/script.php on line21

问题出在哪呢?问题就在于上面的代码混淆了返回值和返回引用。在PHP中,除非你显示的指定返回引用,否则对于数组PHP是值返回,也就是数组的拷贝。因此上面代码对返回数组赋值,实际是对拷贝数组进行赋值,非原数组赋值。

// getValues() returns a COPY of the $values array, so this adds a ‘test‘ element

// to a COPY of the $values array, but not to the $values array itself.

$config->getValues()[‘test‘]=‘test‘;

// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn‘t

// contain a ‘test‘ element (which is why we get the "undefined index" message).

echo$config->getValues()[‘test‘];

下面是一种可能的解决办法,输出拷贝的数组,而不是原数组:

$vals=$config->getValues();

$vals[‘test‘]=‘test‘;

echo$vals[‘test‘];

如果你就是想要改变原数组,也就是要反回数组引用,那应该如何处理呢?办法就是显示指定返回引用即可:

classConfig

{

private$values=[];

// return a REFERENCE to the actual $values array

publicfunction&getValues(){

return$this->values;

}

}

$config=newConfig();

$config->getValues()[‘test‘]=‘test‘;

echo$config->getValues()[‘test‘];

经过改造后,上面代码将会像你期望那样会输出test。

我们再来看一个例子会让你更迷糊的例子:

classConfig

{

private$values;

// using ArrayObject rather than array

publicfunction __construct(){

$this->values=newArrayObject();

}

publicfunction getValues(){

return$this->values;

}

}

$config=newConfig();

$config->getValues()[‘test‘]=‘test‘;

echo$config->getValues()[‘test‘];

如果你想的是会和上面一样输出“ Undefined index”错误,那你就错了。代码会正常输出“test”。原因在于PHP对于对象默认就是按引用返回的,而不是按值返回。

综上所述,我们在使用函数返回值时,要弄清楚是值返回还是引用返回。PHP中对于对象,默认是引用返回,数组和内置基本类型默认均按值返回。这个要与其它语言区别开来(很多语言对于数组是引用传递)。

像其它语言,比如Java或C#,利用getter或setter来访问或设置类属性是一种更好的方案,当然PHP默认不支持,需要自己实现:

classConfig

{

private$values=[];

publicfunction setValue($key,$value){

$this->values[$key]=$value;

}

publicfunction getValue($key){

return$this->values[$key];

}

}

$config=newConfig();

$config->setValue(‘testKey‘,‘testValue‘);

echo$config->getValue(‘testKey‘);// echos ‘testValue‘

上面的代码给调用者可以访问或设置数组中的任意值而不用给与数组public访问权限。感觉怎么样:)

错误4:在循环中执行sql查询

在PHP编程中发现类似下面的代码并不少见:

$models=[];

foreach($inputValuesas$inputValue){

$models[]=$valueRepository->findByValue($inputValue);

}

当然上面的代码是没有什么错误的。问题在于我们在迭代过程中$valueRepository->findByValue()可能每次都执行了sql查询:

$result=$connection->query("SELECT `x`,`y` FROM `values` WHERE `value`=".$inputValue);

如果迭代了10000次,那么你就分别执行了10000次sql查询。如果这样的脚本在多线程程序中被调用,那很可能你的系统就挂了。。。

在编写代码过程中,你应该要清楚什么时候应该执行sql查询,尽可能一次sql查询取出所有数据。

有一种业务场景,你很可能会犯上述错误。假设一个表单提交了一系列值(假设为IDs),然后为了取出所有ID对应的数据,代码将遍历IDs,分别对每个ID执行sql查询,代码如下所示:

$data=[];

foreach($idsas$id){

$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` = ".$id);

$data[]=$result->fetch_row();

}

但同样的目的可以在一个sql中更加高效的完成,代码如下:

$data=[];

if(count($ids)){

$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` IN (".implode(‘,‘,$ids));

while($row=$result->fetch_row()){

$data[]=$row;

}

}

错误5:内存使用低效和错觉

一次sql查询获取多条记录比每次查询获取一条记录效率肯定要高,但如果你使用的是php中的MySQL扩展,那么一次获取多条记录就很可能会导致内存溢出。

我们可以写代码来实验下(测试环境: 512MB RAM、MySQL、php-cli):

// connect to mysql

$connection=newmysqli(‘localhost‘,‘username‘,‘password‘,‘database‘);

// create table of 400 columns

$query=‘CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT‘;

for($col=0;$col<400;$col++){

$query.=", `col$col` CHAR(10) NOT NULL";

}

$query.=‘);‘;

$connection->query($query);

// write 2 million rows

for($row=0;$row<2000000;$row++){

$query="INSERT INTO `test` VALUES ($row";

for($col=0;$col<400;$col++){

$query.=‘, ‘.mt_rand(1000000000,9999999999);

}

$query.=‘)‘;

$connection->query($query);

}

现在来看看资源消耗:

// connect to mysql

$connection=newmysqli(‘localhost‘,‘username‘,‘password‘,‘database‘);

echo"Before: ".memory_get_peak_usage()."\n";

$res=$connection->query(‘SELECT `x`,`y` FROM `test` LIMIT 1‘);

echo"Limit 1: ".memory_get_peak_usage()."\n";

$res=$connection->query(‘SELECT `x`,`y` FROM `test` LIMIT 10000‘);

echo"Limit 10000: ".memory_get_peak_usage()."\n";

输出结果如下:

Before:224704

Limit1:224704

Limit10000:224704

根据内存使用量来看,貌似一切正常。为了更加确定,试着一次获取100000条记录,结果程序得到如下输出:

PHPWarning:mysqli::query():(HY000/2013):

Lostconnection toMySQLserver during queryin/root/test.php on line11

这是怎么回事呢?

问 题出在php的mysql模块的工作方式,mysql模块实际上就是libmysqlclient的一个代理。在查询获取多条记录的同时,这些记录会直接 保存在内存中。由于这块内存不属于php的内存模块所管理,所以我们调用memory_get_peak_usage()函数所获得的值并非真实使用内存 值,于是便出现了上面的问题。

我们可以使用mysqlnd来代替mysql,mysqlnd编译为php自身扩展,其内存使用由php内存管理模块所控制。如果我们用mysqlnd来实现上面的代码,则会更加真实的反应内存使用情况:

Before:232048

Limit1:324952

Limit10000:32572912

更加糟糕的是,根据php的官方文档,mysql扩展存储查询数据使用的内存是mysqlnd的两倍,因此原来的代码使用的内存是上面显示的两倍左右。

为了避免此类问题,可以考虑分几次完成查询,减小单次查询数据量:

$totalNumberToFetch=10000;

$portionSize=100;

for($i=0;$i<=ceil($totalNumberToFetch/$portionSize);$i++){

$limitFrom=$portionSize*$i;

$res=$connection->query(

"SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize");

}

联系上面提到的错误4可以看出,在实际的编码过程中,要做到一种平衡,才能既满足功能要求,又能保证性能。

错误6:忽略Unicode/UTF-8问题

php编程中,在处理非ascii字符时,会遇到一些问题,要很小心的去对待,要不然就会错误遍地。举个简单的例子,strlen($name),如果$name包含非ascii字符,那结果就有些出乎意料。在此给出一些建议,尽量避免此类问题:

如果你对unicode和utf-8不是很了解,那么你至少应该了解一些基础。推荐阅读这篇文章

最好使用mb_*函数来处理字符串,避免使用老的字符串处理函数。这里要确保PHP的“multibyte”扩展已开启。

数据库和表最好使用unicode编码。

知道jason_code()函数会转换非ascii字符,但serialize()函数不会。

php代码源文件最好使用不含bom的utf-8格式。

在此推荐一篇文章,更详细的介绍了此类问题:UTF-8 Primer for PHP and MySQL

错误7:假定$_POST总是包含POST数据

PHP中的$_POST并非总是包含表单POST提交过来的数据。假设我们通过jQuery.ajax() 方法向服务器发送了POST请求:

// js

$.ajax({

url:‘http://my.site/some/path‘,

method:‘post‘,

data:JSON.stringify({a:‘a‘,b:‘b‘}),

contentType:‘application/json‘

});

注意代码中的 contentType: ‘application/json’ ,我们是以json数据格式来发送的数据。在服务端,我们仅输出$_POST数组:

// php

var_dump($_POST);

你会很惊奇的发现,结果是下面所示:

array(0){}

为什么是这样的结果呢?我们的json数据 {a: ‘a’, b: ‘b’} 哪去了呢?

答案就是PHP仅仅解析Content-Type为 application/x-www-form-urlencoded 或 multipart/form-data的Http请求。之所以这样是因为历史原因,PHP最初实现$_POST时,最流行的就是上面两种类型。因此虽说现在有些类型(比如application/json)很流行,但PHP中还是没有去实现自动处理。

因为$_POST是全局变量,所以更改$_POST会全局有效。因此对于Content-Type为 application/json的请求,我们需要手工去解析json数据,然后修改$_POST变量。

// php

$_POST=json_decode(file_get_contents(‘php://input‘),true);

此时,我们再去输出$_POST变量,则会得到我们期望的输出:

array(2){["a"]=>string(1)"a"["b"]=>string(1)"b"}

错误8:认为PHP支持字符数据类型

看看下面的代码,猜测下会输出什么:

for($c=‘a‘;$c<=‘z‘;$c++){

echo$c."\n";

}

如果你的回答是输出’a’到’z’,那么你会惊奇的发现你的回答是错误的。

不错,上面的代码的确会输出’a’到’z’,但除此之外,还会输出’aa’到’yz’。我们来分析下为什么会是这样的结果。

在PHP中不存在char数据类型,只有string类型。明白这点,那么对’z’进行递增操作,结果则为’aa’。对于字符串比较大小,学过C的应该都知道,’aa’是小于’z’的。这也就解释了为何会有上面的输出结果。

如果我们想输出’a’到’z’,下面的实现是一种不错的办法:

for($i=ord(‘a‘);$i<=ord(‘z‘);$i++){

echochr($i)."\n";

}

或者这样也是OK的:

$letters=range(‘a‘,‘z‘);

for($i=0;$i

echo$letters[$i]."\n";

}

错误9:忽略编码标准

虽说忽略编码标准不会导致错误或是bug,但遵循一定的编码标准还是很重要的。

没有统一的编码标准会使你的项目出现很多问题。最明显的就是你的项目代码不具有一致性。更坏的地方在于,你的代码将更加难以调试、扩展和维护。这也就意味着你的团队效率会降低,包括做一些很多无意义的劳动。

对于PHP开发者来说,是比较幸运的。因为有PHP编码标准推荐(PSR),由下面5个部分组成:

PSR-0:自动加载标准

PSR-1:基本编码标准

PSR-2:编码风格指南

PSR-3:日志接口标准

PSR-4:自动加载

PSR最初由PHP社区的几个大的团体所创建并遵循。Zend, Drupal, Symfony, Joomla及其它的平台都为此标准做过贡献并遵循这个标准。即使是PEAR,早些年也想让自己成为一个标准,但现在也加入了PSR阵营。

在 某些情况下,使用什么编码标准是无关紧要的,只要你使用一种编码风格并一直坚持使用即可。但是遵循PSR标准不失为一个好办法,除非你有什么特殊的原因要 自己弄一套。现在越来越多的项目都开始使用PSR,大部分的PHP开发者也在使用PSR,因此使用PSR会让新加入你团队的成员更快的熟悉项目,写代码时 也会更加舒适。

错误10:错误使用empty()函数

一些PHP开发人员喜欢用empty()函数去对变量或表达式做布尔判断,但在某些情况下会让人很困惑。

首先我们来看看PHP中的数组Array和数组对象ArrayObject。看上去好像没什么区别,都是一样的。真的这样吗?

// PHP 5.0 or later:

$array=[];

var_dump(empty($array));// outputs bool(true)

$array=newArrayObject();

var_dump(empty($array));// outputs bool(false)

// why don‘t these both produce the same output?

让事情变得更复杂些,看看下面的代码:

// Prior to PHP 5.0:

$array=[];

var_dump(empty($array));// outputs bool(false)

$array=newArrayObject();

var_dump(empty($array));// outputs bool(false)

很不幸的是,上面这种方法很受欢迎。例如,在Zend Framework 2中,Zend\Db\TableGateway 在 TableGateway::select() 结果集上调用 current() 方法返回数据集时就是这么干的。开发人员很容易就会踩到这个坑。

为了避免这些问题,检查一个数组是否为空最后的办法是用 count() 函数:

// Note that this work in ALL versions of PHP (both pre and post 5.0):

$array=[];

var_dump(count($array));// outputs int(0)

$array=newArrayObject();

var_dump(count($array));// outputs int(0)

在这顺便提一下,因为PHP中会将数值0认为是布尔值false,因此 count() 函数可以直接用在 if 条件语句的条件判断中来判断数组是否为空。另外,count() 函数对于数组来说复杂度为O(1),因此用 count() 函数是一个明智的选择。

再来看一个用 empty() 函数很危险的例子。当在魔术方法 __get() 中结合使用 empty() 函数时,也是很危险的。我们来定义两个类,每个类都有一个 test 属性。

首先我们定义 Regular 类,有一个 test 属性:

classRegular

{

public$test=‘value‘;

}

然后我们定义 Magic 类,并用 __get() 魔术方法来访问它的 test 属性:

classMagic

{

private$values=[‘test‘=>‘value‘];

publicfunction __get($key)

{

if(isset($this->values[$key])){

return$this->values[$key];

}

}

}

好了。我们现在来看看访问各个类的 test 属性会发生什么:

$regular=newRegular();

var_dump($regular->test);// outputs string(4) "value"

$magic=newMagic();

var_dump($magic->test);// outputs string(4) "value"

到目前为止,都还是正常的,没有让我们感到迷糊。

但在 test 属性上使用 empty() 函数会怎么样呢?

var_dump(empty($regular->test));// outputs bool(false)

var_dump(empty($magic->test));// outputs bool(true)

结果是不是很意外?

很不幸的是,如果一个类使用魔法 __get() 函数来访问类属性的值,没有简单的方法来检查属性值是否为空或是不存在。在类作用域外,你只能检查是否返回 null 值,但这并不一定意味着没有设置相应的键,因为键值可以被设置为 null 。

相比之下,如果我们访问 Regular 类的一个不存在的属性,则会得到一个类似下面的Notice消息:

Notice:Undefinedproperty:Regular::$nonExistantTestin/path/to/test.php on line10

CallStack:

0.00122347041.{main}()/path/to/test.php:0

因此,对于 empty() 函数,我们要小心的使用,要不然的话就会结果出乎意料,甚至潜在的误导你。

更多PHP相关技术请搜索千锋PHP,做真实的自己,用良心做教育。

互联网+时代,时刻要保持学习,携手千锋PHP,Dream

It Possible。

时间: 2024-10-30 22:30:13

PHP 编程中 10 个最常见的错误,你犯过几个?的相关文章

PHP编程中10个最常见的错误

PHP是一种非常流行的开源服务器端脚本语言,你在万维网看到的大多数网站都是使用php开发的.本篇经将为大家介绍PHP开发中10个最常见的问题,希望能够对朋友有所帮助. 错误1:foreach循环后留下悬挂指针 在foreach循环中,如果我们需要更改迭代的元素或是为了提高效率,运用引用是一个好办法: 1 2 3 4 5 $arr = array(1, 2, 3, 4); foreach ($arr as &$value) {     $value = $value * 2; } // $arr

2018.6.10 Oracle数据库常见的错误汇总

1.ClassNoFoundException 找不到注册驱动 可能原因:1>驱动名称不对 2>没有导入数据库驱动包 2.SQl 语句中可以使用任何有效的函数,函数操作的列,必须指定别名,否则会出现 java.sql.SQLException: 列名无效 3.java.sql.SQLException: 无效的列索引: sql串里面?号的数目和提供的变量数目不一致 4.java.sql.SQLException: 结果集已耗尽 操作结果集的时候结果集的指针指向了结果集之外 例如:rs.befo

Android 应用中十大常见 UX 错误

[核心提示] Android 开发者关系团队每天都会试用无数的 App 或者受到无数的开发者发来的请求评测的 App,在评测如此之多的应用之后,他们总结出了10个最常见的错误. 作为一个长期使用 Android 的用户,我在使用 Android 应用的时候经常遇到各种各样的交互上的问题,并且早就想整理它们写一篇文章了.但是由于懒惰和拖延,这篇文章一直处于草稿的状态.正巧,这期 ADiA 中,Android 开发团队为我们着重强调了当下 Android 应用中很常见的,应该避免的错误. Andro

Java程序员注意——扼杀性能的 10 个常见 Hibernate 错误

你有没有想过如果你能解决Hibernate问题,那么你的应用程序可以更快? 那么请阅读这篇文章! 我在很多应用程序中修复过性能问题,其中大部分都是由同样的错误引起的.修复之后,性能变得更溜,而且其中的大部分问题都很简单.所以,如果你想改进应用程序,那么可能也是小菜一碟. 这里列出了导致Hibernate性能问题的10个最常见的错误,以及如何修复它们. 错误1:使用Eager Fetching FetchType.EAGER的启示已经讨论了好几年了,而且有很多文章对它进行了详细的解释.我自己也写了

常见 Datagrid 错误

摘要:学习如何避免在使用 ASP.NET Datagrid 控件进行开发时可能发生的一些常见错误(本文包含一些指向英文站点的链接). Datagrid 控件是 Microsoft® ASP.NET 中功能最强.用途最广的 Web 控件之一,这一点已经得到了 ASP.NET 权威人士的认同.虽然 Datagrid 控件易于使用,但同样易于给使用者带来麻烦.以下是许多人所犯的一些错误,这些人包括从初学者到富有经验的 .NET 专家.您可以看到许多苦闷的使用者在 ASP.NET 新闻组和论坛就这些错误

java中10大常见异常

NO.1 java.lang.NullPointerException 这个异常大家肯定都经常遇到,异常的解释是 "程序遇上了空指针 ",简单地说就是调用了未经初始化的对象或者是不存在的对象,这个错误经常出现在创建图片,调用数组这些操作中,比如图片未经初始化,或者图片创建时的路径错误等等.对数组操作中出现空指针,很多情况下是一些刚开始学习编程的朋友常犯的错误,即把数组的初始化和数组元素的初始化混淆起来了.数组的初始化是对数组分配需要的空间,而初始化后的数组,其中的元素并没有实例化,依然

Java 编程中关于异常处理的 10 个最佳实践

异常处理是书写 强健 Java应用的一个重要部分.它是关乎每个应用的一个非功能性需求,是为了优雅的处理任何错误状况,比如资源不可访问,非法输入,空输入等等.Java提供了几个异常处理特性,以try,catch和finally 关键字的形式内建于语言自身之中.Java编程语言也允许你创建新的异常,并通过使用  throw 和 throws关键字抛出它们.事实上,异常处理不仅仅是知道语法.书写一个强健的代码更多的是一门艺术而不仅仅是一门科学,这里我们将讨论一些关于异常处理的Java最佳实践.这些 J

Master the 10 Most Common Python Programming Problems - 10大最常见的Python编程错误

http://blog.csdn.net/pipisorry/article/details/45175457 Introduction 本文介绍python编程中很难捕捉10大错误 (Note: This article is intended for a more advanced audience than Common Mistakes of Python Programmers, which is geared(适合) more toward those who are newer t

编程中关于异常处理的10个最佳实践

在实践中,异常处理不单单是知道语法这么简单.编写健壮的代码是更像是一门艺术,在本文中,将讨论java异常处理最佳实践.这些Java最佳实践遵循标准的JDK库,和几个处理错误和异常的开源代码.这还是一个提供java程序员编写健壮代码的便利手册. Java 编程中异常处理的最佳实践 这里是我通过在国内著名的IT培训平台扣丁学堂在线学习收集的10个java编程中进行异常处理的10最佳实践.在Java编程中对于检查异常有褒有贬,强制处理异常是一门语言的功能.在本文中,我们将尽量减少使用检查型异常,同时学