《计算机视觉中的多视图几何》笔记(1)

2023-09-13 20:51:15

1 Introduction – a Tour of Multiple View Geometry

本章介绍了本书的主要思想。

1.1 Introduction – the ubiquitous projective geometry

为了了解为什么我们需要射影几何,我们从熟悉的欧几里得几何开始。 欧几里得几何在二维中认为平行线是不会相交的,解决这个问题的一种常见手段是说平行线“在无穷远”相交。 然而,这并不完全令人信服,并且与另一个格言相冲突,即无穷不存在,而只是一个方便的虚构。 我们可以通过在平行线相交的无穷远处添加这些点来增强欧几里得平面,并通过将它们称为“理想点”来解决无穷远的困难,从而解决这个问题。

通过将这些无穷远点相加,熟悉的欧几里得空间就转变为一种新型的几何对象,即射影空间。 这是一种非常有用的思维方式,因为我们熟悉欧几里得空间的属性,涉及距离、角度、点、线和入射等概念。 射影空间并没有什么非常神秘的地方——它只是欧几里得空间的延伸,其中两条线总是交汇于一点,尽管有时交汇于无穷远的点。

一个简单的2D欧式点(x, y)可以添加一个额外的坐标变为(x, y, 1),也可以表示为(kx, ky, k)。那么,我们可以观察到,虽然 (x, y, 1) 表示与坐标对 (x, y) 相同的点,但没有对应于 (x, y, 0) 的点。 如果我们尝试除以最后一个坐标,我们会得到无穷大的点 (x/0, y/0)。 这就是无穷远点的产生方式。 它们是由齐次坐标表示的点,其中最后一个坐标为零。所以,(x, y, 0)表示无穷远点。

平移和旋转被称为欧式变换,射影变换是相当于在齐次坐标下面乘了一个齐次矩阵,这是机器视觉和图形学、机器人中常见的表示方法。更通用的变换类型是线性变换,然后移动空间原点的欧几里得变换。 我们可以将其视为空间在不同方向上以不同比例移动、旋转并最终线性拉伸,由此产生的变换称为仿射变换。

1.2 Camera projections

摄像机投影的原理可以看成是从射影空间到射影平面的投影,通过一个3x4的矩阵转换一下齐次坐标就可以。

摄像机可以被视作一个点。

关于相机,如果一个相机中能够得到IAC(绝对二次曲线的图像),那么我们说相机已经标定。

1.3 Reconstruction from more than one view

考虑两幅图的重建,重构往往是会产生很多组解的。必须至少有7个不在临界位置的点,来确定重构的结果。
我们的目标是已知两幅图中的对应点,想要获取他们的相机坐标和对应的3D坐标,这种求解一定是带有不确定性的,不确定性可以用投影变换来描述,这种重建叫做投影重建。
重建的基本方法是找基础矩阵,基础矩阵意味着两个图像的对应相同的3D点。
重建的主要流程:找基础矩阵,求相机矩阵,在用三角法求对应的3D点。

1.4 Three-view geometry

对应三幅图的重建,基本原理跟两视角重建差不多,不过计算起来会更复杂。

1.5 Four view geometry and n-view reconstruction

对多视图的重建,针对不同序列有不同的重建方法,一个基本的步骤是bundle adjustment,这一步需要反复迭代式的调整。

1.6 Transfer

我们已经讨论了从一组图像进行 3D 重建。 射影几何的另一个有用的应用是传递:给定一个(或多个)图像中的点的位置,确定它在该组的所有其他图像中出现的位置。 为此,我们必须首先使用(例如)一组辅助点对应关系来建立摄像机之间的关系。

1.7 Euclidean reconstruction

欧式几何的重建,根本任务是要找绝对二次曲线所在的平面和无穷远的平面。只要找到了这两个平面,所有的欧式几何结构都将被知道。

1.8 Auto-calibration

更多推荐

文举论金:黄金原油全面走势分析策略指导。

市场没有绝对,涨跌没有定势,所以,对市场行情的涨跌平衡判断就是你的制胜法宝。欲望!有句意大利谚语:让金钱成为我们忠心耿耿的仆人,否则,它就会成为一个专横跋扈的主人。空头,多头都能赚钱,唯有贪心不能赚。是你掌控欲望还是欲望掌控你?古人云:不积硅步无以至千里,不积小流无以成江海。希望这句话成为我们之间的共勉。自知!人贵自知

百度 RT-DETR : 在实时目标检测上击败所有 YOLO !

论文地址:https://arxiv.org/abs/2304.08069代码地址:https://github.com/PaddlePaddle/PaddleDetection最近,基于端到端的Transformer检测器(DETRs)取得了显著的性能。然而,DETRs的高计算成本问题尚未得到有效解决,这限制了它们的

【计算机网络】图解应用层协议

图解应用层协议1.应用层2.远程登录2.1Telnet2.2SSH3.文件传输3.1FTP3.2TFTP4.电子邮件4.1通信架构4.2邮件地址4.3SMTP协议4.4POP3协议4.5IMAP协议5.WWW5.1URI5.2HTML5.3HTTP6.网络管理应用6.1DHCP协议6.2DNS协议1.应用层我们前面介绍

软件设计模式系列之七——原型模式

1模式的定义原型模式(PrototypePattern)是一种创建型设计模式,其主要目的是通过复制现有对象来创建新对象,而不是使用构造函数。原型模式将对象的创建委托给原型对象,通过克隆(复制)来生成新对象,这种方式可以避免对象的重复初始化,提高性能,并使对象的创建更加灵活和动态。原型模式的关键思想是通过复制已有对象的属

【视觉SLAM入门】8. 回环检测,词袋模型,字典,感知,召回,机器学习

"见人细过掩匿盖覆”1.意义2.做法2.1词袋模型和字典2.1.2感知偏差和感知变异2.1.2词袋2.1.3字典2.2匹配(相似度)计算3.提升前言:前端提取数据,后端优化数据,但误差会累计,需要回环检测构建全局一致的地图;1.意义通俗的讲,机器人两次经过同一个场景,为了检测是同一个场景,这就是回环检测。它可以用来构建

金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计

『吴秋霖赠书活动 | 第二期』《ChatGPT原理与实战》

文章目录1.写在前面2.Tansformer架构模型3.ChatGPT原理4.提示学习与大模型能力的涌现4.1提示学习4.2上下文学习4.3思维链5.行业参考与建议5.1拥抱变化5.2定位清晰5.3合规可控5.4经验沉淀千模大战正酣,吃透ChatGPT是制胜关键!声明:赠书活动是博主与出版社达成合作,只属于粉丝的专属福

【Azure】微软 Azure 基础解析(九)Azure 标识、身份管理、Azure AD 的功能与用途

本系列博文还在更新中,收录在专栏:「Azure探秘:构建云计算世界」专栏中。本系列文章列表如下:【Azure】微软Azure基础解析(三)云计算运营中的CapEx与OpEx,如何区分CapEx与OpEx【Azure】微软Azure基础解析(四)Azure核心结构组件之数据中心、区域与区域对、可用区和地理区域【Azure

可编程交易区块为DeFi机器人提供强大动力

对于选择基金投资的人来说,一个基本指导原则就是寻找那些管理费最低的基金。资本应该是在运转,而不是用于支付费用。同样,MystenLab的Capy交易机器人利用可编程交易区块(ProgrammableTransactionBlocks,PTBs)将资本集中用于交易,而不是gas费,并且能够执行复杂的输入策略。Mysten

从人工测绘到无人机航测:探索测绘技术的巨大变革

在测绘领域,随着科技的不断进步,测绘技术也在不断演进。人工测绘、传统航测以及如今的无人机航测,每一次进步都为我们提供了更加精确和高效的地图数据。本文将带你深入探索这些技术的演变及其应用。一、人工测绘的时代早期的地图制作依赖于人工测绘,测量员们耗费大量时间和精力进行地面观测和数据记录。虽然人工测绘的精度一直被认为是比较可

【深度学习】Pytorch 系列教程(十三):PyTorch数据结构:5、数据加载器(DataLoader)

目录一、前言二、实验环境三、PyTorch数据结构0、分类1、张量(Tensor)2、张量操作(TensorOperations)3、变量(Variable)4、数据集(Dataset)5、数据加载器(DataLoader)一、前言ChatGPT:PyTorch是一个开源的机器学习框架,广泛应用于深度学习领域。它提供了

热文推荐