AI-Azure上的认知服务之Computer Vision(计算机视觉)

使用 Azure 的计算机视觉服务,开发人员可以访问用于处理图像并返回信息的高级算法。

主要包含如下高级算法:

标记视觉特性Tag visual features

检测对象Detect objects

图像分类Categorize an image

描述图像Describe an image

检测人脸Detect faces

检测图像类型Detect image types

检测特定领域的内容Detect domain-specific content

检测颜色方案Detect the color scheme

生成缩略图Generate a thumbnail

获取感兴趣区域Get the area of interest

从图像中提取文本Extract text from images

管理图像中的内容Moderate content in images

要使用Computer Vision,图像质量必须满足如下要求

  1. 图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
  2. 图像的文件大小必须不到 4 兆字节 (MB)
  3. 图像的尺寸必须大于 50 x 50 像素
  4. 对于 OCR,图像的尺寸必须介于 50 x 50 和 4200 x 4200 像素之间

若要分析图像,可以上传图像,也可以指定图像URL。

图像处理算法可以通过多种不同的方式分析内容,具体取决于你感兴趣的视觉功能。 例如,计算机视觉可以确定图像是否包含成人内容或不雅内容,或者查找图像中的所有人脸。

可以在应用程序中使用计算机视觉,方法是:使用本机SDK,或者直接调用 REST API。 SDK中,支持最全的是C# ,部分功能包含Java,NodeJS,Python,Go SDK。

本节实战视频,如何使用Computer Vision:

https://v.qq.com/x/page/m3035yaq8lf.html

下面分别举几个例子介绍计算机视觉API的功能:

图像标记-Tags

计算机视觉在上千个可识别对象、生物、风景和操作的基础上返回标记。 当标记内容不明确或者不属常识时,API 响应会提供“提示”来澄清标记在已知场景中的含义。 标记不按分类来组织,且不存在继承层次结构。 内容标记集合在一起,形成图像“说明”的基础。该“说明”以人类可读语言显示,采用完整句子的格式。 请注意,图像说明目前只能使用英语。

上传图像或指定图像 URL 后,计算机视觉算法在对象、生物和图像中标识的操作的基础上输出标记。 标记不限于主体(例如前景中的人),还包括场景(户内或户外)、家具、工具、植物、动物、配件、小器具等。

结果示例:"tags": [        {            "name": "grass",            "confidence": 0.9999995231628418        },        {            "name": "outdoor",            "confidence": 0.99992108345031738        },        {            "name": "house",            "confidence": 0.99685388803482056        }]?

对象检测-Detect common objects in images

对象检测类似于标记,但是 API 返回找到的每个对象的边框坐标(以像素为单位)。 例如,如果图像包含狗、猫和人,检测操作将列出这些对象及其在图像中的坐标。

结果示例:"objects":[      {         "rectangle":{            "x":730,            "y":66,            "w":135,            "h":85         },         "object":"kitchen appliance",         "confidence":0.501      },      {         "rectangle":{            "x":523,            "y":377,            "w":185,            "h":46         },?

图像进行分类-Categorize images by subject matter

计算机视觉还返回图像中检测到的基于分类的类别。 不同于标记,类别是在父/子继承层次结构中组织的,并且数量更少(86 个,与数千个标记截然相反)。 所有类别名称均采用英语。 它可以单独完成分类,也可以与新的标记模型共同完成。

示例结果: "faces": [        {            "age": 23,            "gender": "Female",            "faceRectangle": {                "top": 45,                "left": 194,                "width": 44,                "height": 44            }        }    ]

已支持的分类列表:

https://docs.azure.cn/zh-cn/cognitive-services/computer-vision/category-taxonomy

除了上述内容,还支持手写体识别,表单识别等等,具体请参见官网:

https://docs.azure.cn/zh-cn/cognitive-services/computer-vision/concept-detecting-image-types

接下来,我们做一个案例,对如下图像进行检测,图像位置:

https://upload.wikimedia.org/wikipedia/commons/3/3c/Shaki_waterfall.jpg

本案例步骤:

  1. 在Azure创建Computer Vison API;
  2. 使用Azure提供的 Online API 测试工具;
  3. 使用Postman进行测试;

本案例完整内容,参照本文开始视频。

可使用如下地址进行在线测试:

https://dev.cognitive.azure.cn/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa/console

其中必填项如下图所示:

Request Body和结果如下:

Postman测试如下图所示:

原文地址:https://www.cnblogs.com/shuzhenyu/p/12048919.html

时间: 2024-12-12 04:36:53

AI-Azure上的认知服务之Computer Vision(计算机视觉)的相关文章

Azure上部署FTP服务

FTP是个比较复杂的协议,其协议分为控制层和数据层,工作模式分为主动和被动两种模式. 在默认的Active模式下其工作原理如下: 可以看到,客户端发起FTP的请求道服务器端,FTP的端口是21.用户在控制层面通过认证后,会通知服务器其开放的随机端口号.随后服务器端将主动发起源端口为TCP 20目标端口为TCP 随机端口号的连接请求,进行数据连接. 在一般情况下,FTP的服务器和客户端都是在防火墙之后的,服务器端的防火墙要明确配置此服务器要对外提供哪些服务的端口,客户端的防火墙要求必须是客户端主动

在Azure上创建MYSQL服务

Azure和所有的云服务一样,也提供了MYSQL数据库,在Azure中叫mysql database on azure.下面我们来一起在Azure上创建一个Mysql数据库. 在新建--> 数据服务,Mysql database on azure当中选择,快速创建,并填写数据库的响应信息. 1.png 注意:名称只能是全小写. 创建成功后,可以到仪表盘当中看到数据库的响应信息. 2.png 如果需要,可以在帐户 Tab当中添加所需要的帐户,帐户格式为databasename%username,

(转)Hprose与WCF在云计算平台Azure上的对决

Windows Azure Platform是一个运行在微软数据中心的云计算平台.它包括一个云计算操作系统和一个为开发者提供的服务集合.开发人员创建的应用既可以直接在该平台 中运行,也可以使用该云计算平台提供的服务.相比较而言,Windows Azure platform延续了微软传统软件平台的特点,能够为客户提供熟悉的开发体验,用户已有的许多应用程序都可以相对平滑地迁移到该平台上运行.另外 Windows Azure Platform还可以按照云计算的方式按需扩展,在商业开发时可以节省开发部署

Azure 认知服务--计算机视觉 API - 分析图像

在本节中,笔者将详细介绍 Azure 认知服务中的一种:计算机视觉 (Computer Vision) API. 我的一个客户有需求,他们需要消费者与自己的产品合照,然后上传到服务器并转发到朋友圈. 但是为了防止恶意用户上传不健康的照片,需要对图像进行筛查. 计算机视觉 API 的分析图像功能,正好有 Adult 参数,可以检测图像是否是色情的,正好满足客户的需求. 请注意: 本文使用的是国内由世纪互联运维的 Azure China 计算机视觉服务,API 参考. 如果是使用的是海外的 Azur

Azure 认知服务 (4) 计算机视觉API - 读取图片中的文字 (OCR)

<Windows Azure Platform 系列文章目录> 微软Azure认知服务的计算机视觉API,还提供读取图片中的文字功能 在海外的Windows Azure认知服务的读取图片功能,已经集成了用户界面,可以直接读取图片功能. 具体的链接是:https://azure.microsoft.com/zh-cn/services/cognitive-services/computer-vision/ 请注意不要在生产环境中使用这个URL地址,因为服务器是在海外Azure数据中心.网络传输会

Azure 认知服务 (3) 计算机视觉API - 分析图像,使用C#代码

<Windows Azure Platform 系列文章目录> 在上一节中Azure 认知服务 (2) 计算机视觉API - 分析图像,笔者介绍了如何使用API测试控制台进行调试. 本章将介绍如何使用C#代码调用分析图像功能. 我们需要准备: 1.Azure China账户 2.计算机视觉API的API Key 3.分析的图片URL:https://leizhangstorage.blob.core.chinacloudapi.cn/azureblog/analyzeimagesample.j

【AI开发第一步】微软认知服务API应用

目录 介绍 API分类 使用‘视觉’API完成的Demo 点击直接看干货 介绍 从3月份Google家的阿尔法狗打败韩国围棋冠军选手李世石,到之后微软Build2016大会宣布的“智能机器人”战略.种种迹象表明未来慢慢会进入“人工智能”时代,人工智能不再像以前那样听起来高大上,普通的码农屌丝也能开发出具备人类智慧的APP.听起来是不是很叼? 以前是这样的: You:吴博士,您研究的主要方向是撒? 吴博士:人工智能. You:挖槽,好叼.你觉得未来机器人会不会控制人类呢? 吴博士:...... 现

通过流量管理器和 Azure Functions(作为代理)为全球用户提供最靠近的认知服务(或自定义API)

本实战是一个中等复杂度的综合性实战,涉及到的内容有TrafficManager,AzureFunctions,域名/域名解析等几个内容. 本案例基础介绍: https://www.bilibili.com/video/av86424146/ 本案例实战: https://www.bilibili.com/video/av86424146/ Azure上认知服务(人脸,语音,翻译等)很多对外提供API的访问方式,如果我需要做一个全球型的人脸识别或者翻译的项目,则可能最终会在Global多个区域部署

使用Azure上的Azure AD服务管理Office 365账户(无缝打通Azure和Office 365)

Office 365的各个组件运行在Azure AD服务至上,但是在Office 365上面,对账户底层的访问,操作权限有限,整合Azure服务.Office 365.企业内部系统看上去会很困难. 通过这一篇我们,我们可以发现在Azure上面直接调用Office 365的目录服务,无需开发就可以达到Azure上面的应用,都可以访问并使用Office 365账户,只需要将Office 365 和本地做ADFS联盟服务,这样就将Azure上.企业内.和Office 365上所有的应用全部打通了,都基