数据的建立

标注时的原则和理想:

每张图都要在所有类中过滤一遍,看看是否有这类目标。这个工作量很大,可以通过相关去筛选一部分,具体可参见fefei li的文章。

标注尽量细致,越细越好。标注的细了,要求标注的人具有该方面的知识越多,因此也是耗工作量和财力的事情。

数据的筛选,类别定好后,先看看自己手头有的和可收集的数据的分布,然后看看标注质量如何(由于我们是图片,因此用的是显示gt检查标注质量,这个要把人眼睛看瞎了!!!!)。

图像有标注信息,要保持所有标注数据和我们要用的标签是一致的,这个就需要到标注文件里细挖了,唉,也是很不好检查的细活。

最后,就是数据和标注的格式,要统一格式,还要保持一致。

还有是要考虑你要用到的类和不用的那些类是否会有干扰,如果有干扰怎么规避?是删除数据还是进行改造?这个视情况而定,当然也可以看看是否同时出现的概率很高,是否可以忽悠,等等。比如bus, car的干扰是否大,两者是否会同时出现。

还有考虑是否有些类包含了另外一些类,这样的数据也要注意了,这样的数据可能比容易干扰的类带来的影响更大,这个就要进行类别合并或者统一了。

还有就是考虑是否有一些类的背景和另外一些类有干扰,这个有些时候也很重要的。

整体来说,这个东西,第一次整理,各种返工和细致的活。

时间: 2024-09-21 00:51:33

数据的建立的相关文章

多表利用DIH批量导入数据并建立索引注意事项

如果希望同时对多个表进行全文检索,那我们该如何处理呢?利用DIH导入数据并建立索引时.schema.xml中配置了uniqueKey为id <uniqueKey>id</uniqueKey> 如果多表主键都为id的话索引会被覆盖 <!--deltaImportQuery和deltaQuery为增量导入时使用.--> <entity name="case" pk="id" query="SELECT id,title

尽可能保留原有数据,建立UEFI与BIOS双启PE优盘

尽可能保留原有数据,建立UEFI与BIOS双启PE优盘1.确保优盘或者移动硬盘有一个FAT32分区,如果没有FAT32分区,就用傲梅分区助手或者ppm转换一个现有的分区到FAT32分区0x0C,或者新建一个FAT32分区,然后把支持UEFI启动的WIN8PE.ISO解压到该分区.2.用bootice把优盘或移动硬盘MBR写入grub4dos0.4.5c,然后把grldr,grldr.mbr,menu.lst拷贝到根目录,目录结构如下:X:\ │ grldr │ grldr.mbr │ menu.

Sql—表格的建立,删除,数据的建立与删除-总结篇

一,Sql—表格的建立,删除,数据的建立与删除 Sql表格的建立公式 If exists (select * from sysobjects where <表名> Drop table <表名> Create table <表名> (<列名1> <数据类型> <约束类型> <是否为空>, <列名2> <数据类型> <约束类型> <是否为空>,    (约束类型如果没有可以不写

【Web API系列教程】3.3 — 实战:处理数据(建立数据库)

前言 在本部分中,你将在EF上使用Code First Migration(http://msdn.microsoft.com/en-us/data/jj591621)来用测试数据建立数据库. 在Tools目录下选择Library Package Manager,然后选择Package Manager Console.在包管理控制台窗口,输入以下命令: Enable-Migrations 这条命令会添加一个名为Migrations的文件夹到你的项目,并添加一个名为Configuration.cs

Azure上linux虚机使用fio测试磁盘,以及附加数据盘建立raid提高iops

客户在 Azure中建立虚拟机后,通常有磁盘性能测试的需求. 针对基Azure 上 Centos  Linux虚拟机环境进行磁盘性能测试. 在Azure中建立Linux虚拟机后,可以看见两个磁盘分别为sda和sdb,其中sda为系统盘,sdb为临时盘.临时盘为虚拟机所在物理服务器的本地存储,在Windows Azure执行计划内或计划外维护时,虚拟机会移动到其他宿主服务器,所以会造成临时盘的内容丢失.除系统盘和临时盘外,Windows Azure还允许用户挂载数据盘.对于Linux虚拟机,系统盘

Oracle已有数据表建立表分区—在线重定义

今天在做数据抽取的时候,发现有一张业务表数据量达到了5000W,所以就想将此表改为分区表.分区表的有点如下: 1.改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度.2.增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用:3.维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可:4.均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能. 第一步:首先对要在线重定义的表自行验证,看该表是否可以重定义,如果不可以则会提示错误信息 SQL>

大数据需要建立规则和标准

作为在上世纪90年代就提出可穿戴设备概念的潘特兰教授,在大数据方面也享有卓著声誉,但他对大数据的看法,站在互联网业者的角度来看略显保守.因为他最为人称道的几个研究方向并非大数据的应用,而是个人数据采集规则,大数据安全和隐私等. 潘特兰的学生中牛人辈出,有发明谷歌眼镜的,也有发明面部识别技术的.潘特兰本人则较为热衷于为大数据采集和应用制定规则,设立标准,甚至还在世界经济论坛这种重大场合为政治及经济人物提供各种与此有关的建议,可以看得出,大数据的规则和秩序是他更为看重的主题.这在当前整个社会对大数据

第54篇ORM对象关系映射 如何使用ORM与数据可建立连接

1. ORM(对象关系映射) 很多语言的很多web框架中都有这个概念 2. 为什么要有ORM? 1. 写程序离不开数据. 2. 在Python程序中要用到数据库中的数据,怎么办? 1. 使用pymysql连接MySQL数据库的步骤 1. import pymysql 2. 建立连接 conn = pymysql.connect( host='127.0.0.1', port=3306, database='day43', user='root', password='123', charset=

SQL Server 不同数据间建立链接服务器进行连接查询

    在平时查询以及导数据时,经常会遇到需要使用两个数据库里数据的情况,这时就会用到在两个服务器之间建立一个链接,进行操作,脚本语句如下: 举例:例如你在测试服务器上想要查询业务库里的数据信息,此脚本就需要在测试服务器上执行,输入业务服务器的IP地址.业务服务器的账户.密码,然后执行语句即可:反之,如果你需要将测试数据库的数据导入正式库内,就需要在正式库内建立可以连接到测试库的链接. --创建链接服务器 exec sp_addlinkedserver 'ITSV' , '' , 'SQLOLE

数据立方建立-如何实现一对多,多对多

我对维度表,实体表,事实表这三种表之间的关系和概念认知比较模糊,当时老大要我去设计一个关于设备的维度和事实表及实体表出来时,结果我就真的去傻乎乎的对设备进行各种维度表和事实表的设计,然后在给老大看的时候各种被怼,最后才认知到设备怎么可能设计的出一个维度表呢,它本身就是一个客观存在的事实,我们是不可能去把一个客观存在的事实做成一个维度去分析的,维度建模中只存在通过各种维度去分析一个事实,而不能通过别的事实角度去分析另一个事实,如果存在这种结构,也应该是指标值(度量值)而不是一个维度. 维度表:维度