Computer vision:algorithm and application 计算机视觉算法与应用

最近在看Computer vision:algorithm and application计算机视觉算法与应用这本书,感觉对机器视觉学习很好的一本书,下面对书本知识和网上的资源作个总结。

先从后面的附录开始看,其中包括数据集站点,相关机器视觉软件和参考文献,对今后算法学习与实现有用。

下面是学长整理的一些资料,现在搬过来学习学习:

以下是computer vision:algorithm and application计算机视觉算法与应用这本书中附录里的关于计算机视觉的一些测试数据集和源码站点,我整理了下,加了点中文注解。

ComputerVision:

Algorithms and Applications

Richard Szeliski

在本书的最后附录中,我总结了一些对学生、教授和研究者有用的附加材料。这本书的网址http://szeliski.org/Book包含了更新的数据集和软件,所以请同时访问它。

C.1 数据集

  关键一点就是在富有挑战性和代表性的数据集上测试你算法。如果可以获得已知的正确结果或者其他人的结果,那么这种测试就可以提供更多的信息(同时也更为量化)。

  近年来,为了测试和评价计算机视觉算法,人们已经建立了大量的数据集。许多这些数据集和软件中的一些在计算机视觉的主页中列出。而一些较新的网站,像CVonline(http://homepages.inf.ed.ac.uk/rbf/CVonline ), VisionBib.Com (http://datasets.visionbib.com/ ), and Computer Vision online(http://computervisiononline.com/ ), 则有指向较新资源的链接。

  下面我列出了一些较为流行的数据集,并按照本书的章节对它们进行分组,分组结果表明它们与书中的哪一章联系最为紧密。

第二章:图像信息

CUReT: Columbia-Utrecht 反射率和纹理数据库Re?ectance and TextureDatabase, http://www1.cs.columbia.edu/CAVE/software/curet/  (Dana, van Ginneken, Nayaret al. 1999).

Middlebury Color Datasets:不同摄像机拍摄的图像,注册后用于研究不同的摄像机怎么改变色域和彩色registeredcolor images taken by different cameras to study how they transform gamuts andcolors, http://vision.middlebury.edu/color/data/ Chakrabarti, Scharstein, and Zickler 2009).

第三章:图像处理

Middlebury test datasets forevaluating MRF minimization/inference algorithms评估隐马尔科夫随机场最小化和推断算法,http://vision.middlebury.edu/MRF/results/ (Szeliski, Zabih, Scharstein et al. 2008).

第四章:特征检测和匹配

Af?ne Covariant Featuresdatabase(反射协变的特征数据集) for evaluating feature detector and descriptor matching quality andrepeatability(评估特征检测和描述匹配的质量和定位精度),   http://www.robots.ox.ac.uk/~vgg/research/affine/(Miko-lajczyk and Schmid 2005;Mikolajczyk, Tuytelaars, Schmid et al. 2005).

Database of matched imagepatches for learning (图像斑块匹配学习数据库)and feature descriptor evaluation(特征描述评估数据库),http://cvlab.epfl.ch/~brown/patchdata/patchdata.html

(Winder and Brown 2007;Hua,Brown, and Winder 2007).

第五章;分割

BerkeleySegmentation Dataset(分割数据库) and Benchmark of 1000 images labeled by 30 humans,(30个人标记的1000副基准图像)along with an evaluation, http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/segbench/  (Martin, Fowlkes, Tal et al.2001).

Weizmann segmentationevaluation database of 100 grayscale images with ground truth segmentations,http://www.wisdom.weizmann.ac.il/~vision/Seg EvaluationDB/index.html (Alpert, Galun, Basri et al. 2007).

第八章:稠密运动估计

TheMiddlebury optic ?ow evaluation(光流评估) Web site, http://vision.middlebury.edu/flow/data/(Baker,Scharstein, Lewis et al. 2009).

The Human-Assisted MotionAnnotation database,(人类辅助运动数据库)http://people.csail.mit.edu/celiu/motionAnnotation/  (Liu, Freeman, Adelson etal. 2008)

第十章:计算机摄像学

High DynamicRange radiance(辐射)maps, http://www.debevec.org/Research/HDR/(De-bevecand Malik 1997).

Alpha matting evaluation Website, http://alphamatting.com/ (Rhemann, Rother, Wang

et al. 2009).

第十一章:Stereo correspondence立体对应

Middlebury Stereo Datasets andEvaluation, http://vision.middlebury.edu/stereo/  (Scharstein and Szeliski 2002).

StereoClassi?cation(立体分类) and Performance Evaluation(性能评估) of different aggregation(聚类) costs for stereo matching(立体匹配),http://www.vision.deis.unibo.it/spe/SPEHome.aspx  (Tombari, Mat-toccia, Di Stefano et al.2008).

Middlebury Multi-View StereoDatasets,http://vision.middlebury.edu/mview/data/  (Seitz,Curless, Diebel etal. 2006).

Multi-view and Oxford Collegesbuilding reconstructions,http://www.robots.ox.ac.uk/~vgg/data/data-mview.html .

Multi-View Stereo Datasets, http://cvlab.epfl.ch/data/strechamvs/  (Strecha, Fransens,and Van Gool 2006).

Multi-View Evaluation,  http://cvlab.epfl.ch/~strecha/multiview/ (Strecha, von Hansen,Van Gool et al. 2008).

第十二章:3D重建

HumanEva: synchronized video(同步视频) and motion capture (动作捕捉)dataset for evaluation ofarticulated human motion,http://vision.cs.brown.edu/humaneva/  Sigal, Balan, and Black 2010).

第十三章:图像渲染

The (New) Stanford Light FieldArchive, http://lightfield.stanford.edu/ (Wilburn, Joshi,Vaish et al.2005).

Virtual Viewpoint Video:multi-viewpoint video with per-frame depth maps, http://research.microsoft.com/en-us/um/redmond/groups/ivm/vvv/  (Zitnick, Kang, Uytten-daele et al. 2004).

第十四章:识别

查找一系列的视觉识别数据库,在表14.1–14.2.除了那些,这里还有:

Buffy pose classes, http://www.robots.ox.ac.uk/~vgg/data/  buffy pose classes/ andBuffy stickmen V2.1, http://www.robots.ox.ac.uk/~vgg/data/stickmen/index.html  (Ferrari,Marin-Jimenez, and Zisserman 2009;Eichner and Ferrari 2009).

H3D database of pose/jointannotated photographs of humans, http://www.eecs.berkeley.edu/~lbourdev/h3d/   (Bourdev and Malik 2009).

Action Recognition Datasets,http://www.cs.berkeley.edu/projects/vision/action, has point-ers toseveral datasets for action and activity recognition, as well as some papers.(有一些关于人活动和运动的数据库和论文) The humanaction database at http://www.nada.kth.se/cvap/actions/  包含更多的行动序列。

C.2 软件资源

一个对于计算机视觉算法最好的资源就是开源视觉图像库(opencv)(http://opencv.willowgarage.com/wiki/),他有在intel的Gary Bradski和他的同事开发,现在由Willow Garage (Bradsky and Kaehler 2008)维护和扩展。一部分可利用的函数在http://opencv.willowgarage.com/documentation/cpp/中:

图像处理和变换 (滤波,形态学,金字塔);

图像几何学的变换 (旋转,改变大小);

混合图像变换 (傅里叶变换,距离变换);

直方图;

分割 (分水岭, mean shift);

特征检测 (Canny, Harris, Hough, MSER, SURF);

运动分析和物体分析 (Lucas–Kanade, mean shift);

相机矫正和3D重建

机器学习 (k nearest neighbors, 支持向量机, 决策树, boost-

ing, 随机树, expectation-maximization, 和神经网络).

Intel的Performance Primitives (IPP)library, http://software.intel.com/en-us/intel-ipp/,包含各种各样的图像处理任务的最佳优化代码,许多opencv中的例子利用了这个库,加入他安装了,程序运行得更快。依据功能,他和Opencv有很多相同的运算处理,并且加上了额外的库针对图像视频压缩,信号语音处理和矩阵代数。

MTALAB中的Image Processing Toolbox图像处理工具,http://www.mathworks.com/products/image/,包含常规的处理,空域变换(旋转,改变大小),常规正交,图像分析和统计学(变边缘,哈弗变换),图像增强(自适应直方图均衡,中值滤波),图像恢复(去模糊),线性滤波(卷积),图像变换(傅里叶,离散余弦变换)和形态学操作(连通域和距离变换)

两个比较旧的库,它们没有被发展,但是包含了一些的有用的常规操作:

VXL (C++Libraries for Computer Vision Research and Implemen-tation, http://vxl.sourceforge.net/)

LTI-Lib 2 (http://www.ie.itcr.ac.cr/palvarado/ltilib-2/homepage/ ).

图像编辑和视图包,例如Windows Live Photo Gallery, iPhoto, Picasa,GIMP, 和 IrfanView,它们对执行这些处理非常有用:常规处理任务,格式转换,观测你的结果。它们同样可以用于对图像处理算法有趣的实现参考,例如色调调整和去噪。

这里他也有一些软件包和基础框架对你建一个实时视频处理的DEMOS很有用,Vision on Tap(http://www.visionontap.com/ )提供一个可以实时处理你的网络摄像头的网页服务(Chiu and Raskar 2009)。Video-Man (VideoManager, http://videomanlib.sourceforge.net/处理实时的基于视频的DEMOS和应用非常有用,你也可以用MATLAB中的imread直接从任何URl(例如网络摄像头)中读取视频。

下面,我列出了一些额外的网络资源,让章节排列以便它们看起来联系更紧密:

第三章:图像处理

matlabPyrTools—MATLAB 下的源码对于拉普拉斯变换,金字塔, QMF/小波, 和steerable pyramids, http://www.cns.nyu.edu/~lcv/software.php  (Simoncelli and Adel-son 1990a; Simoncelli,Freeman, Adelson et al. 1992).

BLS-GSM 图像去噪, http://decsai.ugr.es/~javier/denoise/  (Portilla, Strela,Wain-wright et al. 2003).

Fast bilateral ?ltering code(快速双边滤波), http://people.csail.mit.edu/jiawen/#code (Chen, Paris, and Durand 2007).

C++ implementation of the fastdistance transform algorithm,http://people.cs.uchicago.edu/~pff/dt/  (Felzenszwalb andHuttenlocher 2004a).

GREYC’s Magic Image Converter,including image restoration software using regularization and anisotropicdiffusion,http://gmic.sourceforge.net/gimp.shtml (Tschumperl´ e and Deriche 2005).

第四章:图像特征检测和匹配

VLFeat, 一个开放便捷的计算机视觉算法库

http://vlfeat.org/ (Vedaldi and Fulkerson 2008).

SiftGPU: A GPU Implementationof Scale Invariant Feature Transform (SIFT),GPU实现的尺度特征性变换

http://www.cs.unc.edu/~ccwu/siftgpu/  (Wu 2010).

SURF: Speeded Up RobustFeatures, http://www.vision.ee.ethz.ch/~surf/

(Bay, Tuyte-laars, and VanGool 2006).

FAST corner detection, http://mi.eng.cam.ac.uk/~er258/work/fast.html

(Rosten and Drum-mond 2005, 2006).

Linux binaries for af?neregion detectors and descriptors, as well as MATLAB ?les to

compute repeatability andmatching scores,

http://www.robots.ox.ac.uk/~vgg/research/affine/

Kanade–Lucas–Tomasi featuretrackers: KLT, http://www.ces.clemson.edu/~stb/klt/ (Shi and Tomasi 1994);

GPU-KLT, http://cs.unc.edu/~cmzach/opensource.html  (Zach,Gallup, and Frahm2008); Lucas–Kanade 20 Years On,http://www.ri.cmu.edu/projects/project 515.html  (Baker and Matthews 2004).

第五章:分割

高效的基于图形的分割http://people.cs.uchicago.edu/~pff/segment

(Felzenszwalb and Huttenlocher2004b).

EDISON, 边缘检测和图像追踪,

http://coewww.rutgers.edu/riul/research/code/EDISON/

(Meer and Georgescu 2001; Comaniciu and Meer2002).

Normalized cuts segmentationincluding intervening contours,

http://www.cis.upenn.edu/~jshi/software/

(Shi and Malik 2000; Malik,Belongie, Leung et al. 2001).

Segmentation by weightedaggregation (SWA),利用加权集合的分割

http://www.cs.weizmann.ac.il/~vision/SWA  (Alpert, Galun, Basri et al.2007).

第六章:基于特征的对齐和校准

Non-iterative PnP algorithm,(非迭代PnP算法)

http://cvlab.ep?.ch/software/EPnP  (Moreno-Noguer, Lep-etit, and Fua 2007).

Tsai Camera Calibration(相机矫正) Software,

http://www-2.cs.cmu.edu/~rgw/TsaiCode.html  (Tsai 1987).

Easy CameraCalibration Toolkit,(简易相机校准工具包) http://research.microsoft.com/en-us/um/people/zhang/ Calib/ (Zhang 2000).

Camera Calibration Toolbox forMATLAB,

http://www.vision.caltech.edu/bouguetj/calib doc/ ; a C version is included in OpenCV.

MATLAB functions for multipleview geometry,

http://www.robots.ox.ac.uk/~vgg/hzbook/code/  (Hartley and Zisserman2004).

第七章:运动重建

SBA: A generic sparse bundle(稀疏束) adjustment C/C++ package basedon the Levenberg–

Marquardt algorithm, http://www.ics.forth.gr/~lourakis/sba/  (Lourakis and Argyros 2009).

Simple sparse bundleadjustment (SSBA), http://cs.unc.edu/~cmzach/opensource.html .

Bundler, structure from motionfor unordered image collections(无序图像集),

http://phototour.cs.washington.edu/bundler/   (Snavely, Seitz, and Szeliski 2006).

第八章:稠密运动估计

光流, http://www.cs.brown.edu/~black/code.html (Black and Anan-

dan 1996).

Optical ?ow(光流) using total variation(全变量差) and conjugate gradientdescent(共轭梯度下降), http://people.csail.mit.edu/celiu/OpticalFlow/ (Liu 2009).

TV-L1 optical ?ow on the GPU, http://cs.unc.edu/~cmzach/opensource.html

(Zach,Pock, and Bischof2007a).

elastix: atoolbox for rigid(刚性) and nonrigid(非刚性) registration of images(配准图像), http://elastix.isi.uu.nl/ (Klein, Staring, and Pluim 2007).

Deformable image registration(可变形的配准图像) using discreteoptimization(离散最优化), http://www.mrf-registration.net/deformable/index.html

(Glocker, Komodakis, Tziritas et al. 2008).

第九章:图像缝合

Microsoft Research ImageCompositing Editor for stitching images,(图像拼接,图像合成)

http://research.microsoft.com/en-us/um/redmond/groups/ivm/ice/ .

第十章:计算机摄影学

HDRShop software for combiningbracketed exposures(包围式曝光) into high-dynamic range radiance images,http://projects.ict.usc.edu/graphics/HDRShop/.

Super-resolution(超分辨率) code,

http://www.robots.ox.ac.uk/~vgg/software/SR/  (Pickup 2007;Pickup, Capel,Roberts et al. 2007, 2009).

第十一章:立体对应

StereoMatcher, standalone C++stereo matching code,

http://vision.middlebury.edu/stereo/code/  (Scharstein and Szeliski2002).

Patch-based multi-view stereosoftware (PMVS Version 2),

http://grail.cs.washington.edu/software/pmvs/  (Furukawa and Ponce 2011).

第十二章:3D重建

Scanalyze: a system foraligning and merging range data,

http://graphics.stanford.edu/software/scanalyze/  (Curless and Levoy 1996).

MeshLab: software forprocessing, editing, and visualizing unstructured 3D triangular

meshes, http://meshlab.sourceforge.net/.

VRML viewers (various) arealso a good way to visualize texture-mapped 3D models.

节 12.6.4: Whole body modeling andtracking(全身建模和追踪)

Bayesian 3D person tracking(贝叶斯3D人体追踪), http://www.cs.brown.edu/~black/code.html  (Sidenbladh,Black, and Fleet2000; Sidenbladh and Black 2003).

HumanEva: baseline code forthe tracking of articulated human motion,

http://vision.cs.brown.edu/humaneva/   (Sigal, Balan, and Black 2010).

节 14.1.1: Face detection(人脸检测)

Sample face detection code andevaluation tools,

http://vision.ai.uiuc.edu/mhyang/face-detection-survey.html.

节 14.1.2: Pedestrian detection(行人追踪)

A simple object detector withboosting,

http://people.csail.mit.edu/torralba/shortCourseRLOC/boosting/boosting.html

(Hastie, Tibshirani, and Friedman 2001;Torralba, Murphy, and Freeman 2007).

Discriminatively(有区别) trained deformable(可变形) part models, http://people.cs.uchicago.edu/~pff/latent/  (Felzenszwalb, Girshick,McAllester et al. 2010).

Upper-body detector(上身检测),

http://www.robots.ox.ac.uk/~vgg/software/UpperBody/  (Ferrari,Marin-Jimenez, andZisserman 2008).

2D articulated human poseestimation software,

http://www.vision.ee.ethz.ch/~calvin/articulated_human_pose_estimation_code/  (Eichner and Ferrari 2009).

节 14.2.2: Active appearance and 3Dshape models

AAMtools: An active appearancemodeling toolbox,

http://cvsp.cs.ntua.gr/software/AAMtools/  (Papandreou and Maragos2008).

节 14.3: Instance recognition

FASTANN and FASTCLUSTER forapproximate k-means (AKM),

http://www.robots.ox.ac.uk/~vgg/software/ (Philbin, Chum, Isard et al. 2007).

Feature matching using fastapproximate nearest neighbors,

http://people.cs.ubc.ca/~mariusm/index.php/FLANN/FLANN  (Muja and Lowe 2009).

节 14.4.1: Bag of words(词袋)

Two bag of words classi?ers, http://people.csail.mit.edu/fergus/iccv2005/bagwords.html

(Fei-Fei and Perona 2005;Sivic, Russell, Efros et al. 2005).

Bag of features andhierarchical(分层) k-means, http://www.vlfeat.org/  (Nist´ er and Stew´enius2006; Nowak, Jurie, and Triggs 2006).

节 14.4.2: Part-based models

A simple parts and structureobject detector,

http://people.csail.mit.edu/fergus/iccv2005/partsstructure.html

(Fischler and Elschlager 1973; Felzenszwalband Huttenlocher 2005).

节 14.5.1: Machine learning software

Support vector machines (SVM)software (

http://www.support-vector-machines.org/SVM soft.html )

包含很多支持向量机的库,

SVMlight http://svmlight.joachims.org/ ;

LIBSVM, http://www.csie.ntu.edu.tw/~cjlin/libsvm/(Fan, Chen,and Lin 2005);

LIBLINEAR, http://www.csie.ntu.edu.tw/~cjlin/liblinear/  (Fan,Chang, Hsieh et al.2008).

Kernel Machines: links to SVM,Gaussian processes, boosting, and other machine

learning algorithms, http://www.kernel-machines.org/software .

Multiple kernels for imageclassi?cation,

http://www.robots.ox.ac.uk/~vgg/software/MKL

(Varma and Ray 2007; Vedaldi, Gulshan, Varmaet al. 2009).

附录 A.1–A.2: Matrix decompositions(矩阵分解) and linear least squares(线性最小乘)

BLAS (BasicLinear Algebra Subprograms基本线性代数子程序),

http://www.netlib.org/blas/  (Blackford,Demmel, Dongarraet al. 2002).

LAPACK (Linear Algebra(线性代数) PACKage),

http://www.netlib.org/lapack/  (Anderson, Bai,Bischof etal. 1999).

GotoBLAS, http://www.tacc.utexas.edu/tacc-projects/.

ATLAS (Automatically TunedLinear Algebra Software),

http://math-atlas.sourceforge.net/  (Demmel, Dongarra, Eijkhoutet al. 2005).

Intel Math Kernel Library(MKL), http://software.intel.com/en-us/intel-mkl/.

AMD CoreMath Library (ACML),

http://developer.amd.com/cpu/Libraries/acml/Pages/default.aspx .

Robust PCA code(鲁棒主成分分析), http://www.salle.url.edu/~ftorre/papers/rpca2.html

(De la Torre and Black 2003).

Appendix A.3: Non-linear leastsquares非线性最小二乘

MINPACK, http://www.netlib.org/minpack/.

levmar: Levenberg–Marquardtnonlinear least squares algorithms, 非线性最小二乘

http://www.ics.forth.gr/~lourakis/levmar/  (Madsen, Nielsen, andTingleff 2004).

附录 A.4–A.5: Direct(直接) and iterative(迭代) sparse matrix(稀疏矩阵) solvers

SuiteSparse (variousreordering algorithms, 各种各样的重排算法CHOLMOD) and SuiteSparse QR,http://www.cise.ufl.edu/research/sparse/SuiteSparse/  (Davis 2006, 2008).

PARDISO (iterative and sparsedirect solution),  http://www.pardiso-project.org/.

TAUCS (sparse direct,iterative, out of core, preconditioners),

http://www.tau.ac.il/~stoledo/taucs/ .

HSL Mathematical SoftwareLibrary,  http://www.hsl.rl.ac.uk/index.html .

Templatesfor the solution of linear systems(线性系统解决问题的模板), http://www.netlib.org/linalg/html templates/Templates.html  (Barrett, Berry, Chan et al.1994). Download the PDF for instructions(说明) on how to get the software.

ITSOL,MIQR, and other sparsesolvers,

http://www-users.cs.umn.edu/~saad/software/  (Saad 2003).

ILUPACK, http://www-public.tu-bs.de/~bolle/ilupack/ .

附录 B: Bayesian modeling and inference(贝叶斯建模和推断)

Middleburysource code for MRF minimization(隐马尔科夫随机场最小化), http://vision.middlebury.edu/MRF/code/  (Szeliski, Zabih, Scharsteinet al. 2008).

C++ code for ef?cient beliefpropagation for early vision,

http://people.cs.uchicago.edu/~pff/bp/  (Felzenszwalb andHuttenlocher 2006).

FastPD MRF optimization(最优化) code,

http://www.csd.uoc.gr/~komod/FastPD  (Komodakisand Tziritas2007a; Komodakis, Tziritas, and Paragios 2008)

算法 C.1   Calgorithm for Gaussian random noise generation, using the Box–Mullertransform.

C描述的利用Box–Muller 变换产生高斯随机噪声

double urand()

{

return ((double)rand()) / ((double) RAND MAX);

}

void grand(double& g1, double& g2)

{

#ifndef M_PI

#define M_PI 3.14159265358979323846

#endif // M_PI

double n1 = urand();

double n2 = urand();

double x1 = n1 + (n1 == 0); /* guardagainst log(0) */

double sqlogn1 = sqrt(-2.0 * log (x1));

double angl = (2.0 * M PI) * n2;

g1 = sqlogn1 * cos(angl);

g2 = sqlogn1 * sin(angl);

}

高斯噪声的产生。许多基本的软件包产生一些不同的随机的噪声(例如 运行在unix上的rand()),但是并不是所有的都有高斯随机噪声发生器。计算一个离散随机常量,你可以用Box–Mullertransform (Box and Muller 1958),他的c代码在算法C.1中给出了,注意这个运行结果是返回一对随机变量。相关的产生高斯随机变量的方由Thomas, Luk, Leong et al. (2007)提出。

伪彩色产生。在很多应用中,很方便给图像加上标记(或者给图像特征比如线)。一个最简单的方式就是给不同的标记不同的颜色。在我的工作中,我发现用RGB立体色彩系给不同的标记赋予标准均匀的色彩是很方便的。

对于每一个(非消极)标记值,considerthe bits as being split among the three color channel,例如对于一个比特值为9的值,

这个值可以被标记为RGBRGBRGB,获得三基色中的每一种颜色值后,颠倒比特值,结果是低位的比特值变化的最快。

实际上,对于一个八比特的颜色通道,这个比特值的颠倒可以被存在一个表或者一个存储提前计算好的记录有由标记值向伪彩色的改变的完整表。

图 8.16 显示了这样一个伪彩色绘制的例子.

GPU实现

GPU的出现,可以处理像素着色和计算着色,导致了实时应用的快速计算机视觉算法的发展,例如,分割,追踪,立体和运动估计((Pock, Unger, Cremerset al. 2008; Vineet and Narayanan 2008; Zach,Gallup, and Frahm 2008)。一个好的资源来学习这些算法就是CVPR 2008 上关于Visual Computer Visionon GPUs的workshop。

http://www.cs.unc.edu/~jmf/Workshop_on_Computer_Vision_on_GPU.html他的论文可以在CVPR2008的会议集的DVD中找到。额外的关于GPU算法资源包括GPGPU网址和小组讨论http://gpgpu.org/还有OpenVIDIAWeb site, http://openvidia.sourceforge.net/index.php/OpenVIDIA

C.3 PPT和讲稿

正如我在前言中提到的,我希望提供和书中材料相一致的PPT,直到这些全部准备好,你最好的方式去看我在华盛顿大学上课时的PPT,和一写相关课程中用到的教案。

这里是一些这样的课程列表:

UW 455:Undergraduate Computer Vision,

http://www.cs.washington.edu/education/courses/455/.

UW576:Graduate Computer Vision,

http://www.cs.washington.edu/education/courses/576.

StanfordCS233B: Introduction to Computer Vision,

http://vision.stanford.edu/teaching/cs223b/.

MIT6.869: Advances in Computer Vision,

http://people.csail.mit.edu/torralba/courses/6.869/6.869.computervision.htm.

Berkeley CS 280: Computer Vision, http://www.eecs.berkeley.edu/~trevor/CS280.html

UNC COMP776: Computer Vision, http://www.cs.unc.edu/~lazebnik/spring10.

Middlebury CS 453: Computer Vision,

http://www.cs.middlebury.edu/~schar/courses/cs453-s10/.

Related courses have also been taught onthe topic of Computational Photography, e.g.,

CMU 15-463: Computational Photography, http://graphics.cs.cmu.edu/courses/15-463/.

MIT 6.815/6.865: Advanced ComputationalPhotography,

http://stellar.mit.edu/S/course/6/sp09/6.815

Stanford CS 448A: Computational photographyon cell phones,

http://graphics.stanford.edu/courses/cs448a-10/.

SIGGRAPH courses on ComputationalPhotography,

http://web.media.mit.edu/~raskar/photo/.

这里还有一些最好的关于各种计算机视觉主题的在线讲稿,例如:belief propagation and graph cuts,它们在UW-MSR Course of Vision Algo-rithmshttp://www.cs.washington.edu/education/courses/577/04sp/

C.4 参考文献:

这本的所有参考文献在这本书的网站上,一个几乎所有的计算机视觉的出版物都引用的更全面的部分注解书目由Keith Price维http://iris.usc.edu/Vision-Notes/bibliography/contents.html.

这里还有一个可搜索的计算机图形学的参考书目http://www.siggraph.org/publications/bibliography/另外技术论文比较好的资源是GoogleScholar 和 CiteSeerX。

时间: 2024-07-30 03:21:51

Computer vision:algorithm and application 计算机视觉算法与应用的相关文章

Computer Vision Algorithm Implementations

Participate in Reproducible Research General Image Processing OpenCV (C/C++ code, BSD lic) Image manipulation, matrix manipulation, transforms Torch3Vision (C/C++ code, BSD lic) Basic image processing, matrix manipulation and feature extraction algor

计算机视觉算法与代码集锦

计算机视觉算法与代码集锦 计算机视觉是结合了传统摄影测量,现代计算机信息技术.人工智能等多学科的一个大学科,是一片开垦不足的大陆,路很远,但很多人都在跋涉! 本文转自CSDN(地址http://blog.csdn.net/whucv/article/details/7907391),是一篇很好的算法与代码总结文档,转载在此供大家学习参考. 原文如下: UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下: https://netfiles.uiuc.edu/jbhua

Graph Cut and Its Application in Computer Vision

Graph Cut and Its Application in Computer Vision 原文出处: http://lincccc.blogspot.tw/2011/04/graph-cut-and-its-application-in.html 网络流算法最初用于解决流网络的优化问题,比如水管网络.通信传输和城市的车流等.Graph cut作为其中一类最常见的算法,用于求解流网络的最小割,即寻找一个总容量最小的边集合,去掉这个集合中的所有边将阻断这个网络.图像和视频也能被视作网络(或者

AI-Azure上的认知服务之Computer Vision(计算机视觉)

使用 Azure 的计算机视觉服务,开发人员可以访问用于处理图像并返回信息的高级算法. 主要包含如下高级算法: 标记视觉特性Tag visual features 检测对象Detect objects 图像分类Categorize an image 描述图像Describe an image 检测人脸Detect faces 检测图像类型Detect image types 检测特定领域的内容Detect domain-specific content 检测颜色方案Detect the colo

计算机视觉和人工智能的状态:我们已经走得很远了 The state of Computer Vision and AI: we are really, really far away.

The picture above is funny. But for me it is also one of those examples that make me sad about the outlook for AI and for Computer Vision. What would it take for a computer to understand this image as you or I do? I challenge you to think explicitly

Deep Learning for Computer Vision with MATLAB and cuDNN(译文)

翻译水平有限,欢迎阅读原文 一.深度学习 当前,深度学习已经成为一个热门话题.随着深度学习算法和GPU技术的发展,我们已经能够解决许多领域(计算机视觉.自然语言处理和机器人学)曾经认为不可能的事情. 深度学习是建立在传统的深度神经网络之上的.最近几年的热点是大数据集和强大的GPUs的使用.神经网络本质上是一种并行算法,因此多核GPUs的使用能够明显的减少用于训练深度神经网络的时间.以下,我将会讨论如何使用MATLAB以及深度卷积神经网络和GPUs开发一个对象识别系统 二.为什么将深度学习用于计算

Computer Science - Computer Vision - Intro

Computer Vision - Intro 初探计算机视觉 CV在AI领域的地位 视觉相当于人脑的大门,是人类感知外界世界的最主要途径.该生理构造决定真实世界中的信息主要以视觉为主.所以,如果不能处理视觉信息的话,整个AI领域就几乎无法研究真实的世界.而作为AI领域中的子领域,CV就承担着处理视觉信息的任务.其地位不言而喻. 视觉,它相当于说芝麻开门.大门就在这里面,这个门打不开, 就没法研究真实世界的人工智能. CV与ML的关系 CV是一个领域,下辖很多子问题,就像物理学.而ML基本是一个

My Reading List - Machine Learning && Computer Vision

本博客汇总了个人在学习过程中所看过的一些论文.代码.资料以及常用的资源与网站,为了便于记录自身的学习过程,将其整理于博客之中. Machine Learning (1) Machine Learning Video Library - Caltech说明:罗列了机器学习的常用算法以及机器学习图谱 (2) Deep Learning - Bengio 说明:Deep Learning三大牛之一Bengio写的一本书 (3) Understanding LSTM Networks 说明:非常棒的LS

Computer Vision的尴尬---by林达华

Computer Vision的尴尬---by林达华 Computer Vision是AI的一个非常活跃的领域,每年大会小会不断,发表的文章数以千计(单是CVPR每年就录取300多,各种二流会议每年的文章更可谓不计其数),新模型新算法新应用层出不穷.可是,浮华背后,根基何在?对于Vision,虽无大成,但涉猎数年,也有管窥之见.Vision所探索的是一个非常复杂的世界,对于这样的世界如何建模,如何分析,却一直没有受普遍承认的理论体系.大部分的研究工作,循守着几种模式:o    从上游学科(比如立