近來在做三維姿態恐怕的東西，用到了上的深度攝像頭()，我們都曉得深度攝像頭可以獲得某個點的三維信息（基于此可以做好多有趣的東西，例如三維重建，三維關鍵點跟蹤與檢查，后續有空漸漸填坑），但具體怎么獲得網上能找到的資料也不多，我在這兒整理了一下我近來收集到的資料并提供了基于Swift的示例代碼，該文章分成下邊幾小節來探討。TNH物理好資源網(原物理ok網)

雖然最后估算獲得三維座標系的方式很簡單凸透鏡成像原理應用，但要了解為何要這樣估算須要清楚單反成像的原理。TNH物理好資源網(原物理ok網)

單反大致工作原理TNH物理好資源網(原物理ok網)

X采用的是結構光的方案，這兒以的工作流程來解釋下它是怎樣獲取深度值的：TNH物理好資源網(原物理ok網)

點陣投影器和泛光照明器都可以投射紅外線光點，不同之處在于后者幀率高前者幀率低，且后者投射結構光，前者投射非結構光。TNH物理好資源網(原物理ok網)

這兒并不對原理展開講，感盛行的可以移步閱讀尾部的參考鏈接TNH物理好資源網(原物理ok網)

凸透鏡成像中的焦距和光心TNH物理好資源網(原物理ok網)

不同角度出發的光線經過透鏡，跟透鏡表面產生不同的傾角，形成不同程度的折射。TNH物理好資源網(原物理ok網)

從一個真實世界w的一點出發的光，經過透鏡，又重新匯集到一點，最終產生了點對點的成像關系，從上圖我們可以得出以下幾個名詞的定義。TNH物理好資源網(原物理ok網)

光心：凸透鏡的中心TNH物理好資源網(原物理ok網)

焦點：一束光以凸透鏡的主軸穿過凸透鏡時，在凸透鏡的另外兩側會被凸透鏡凝聚成一點，這一點稱作焦點。TNH物理好資源網(原物理ok網)

焦距：焦點到凸透鏡光心的距離就稱作這個凸透鏡的焦距，一個凸透鏡的一側各自有一個焦點。TNH物理好資源網(原物理ok網)

清楚這幾個基本概念后理解下邊幾個座標系就愈加容易了。TNH物理好資源網(原物理ok網)

單反成像中所用到的世界，單反凸透鏡成像原理應用，圖象，象素座標系TNH物理好資源網(原物理ok網)

我們換一張成像的原理圖TNH物理好資源網(原物理ok網)

成像過程中須要經過幾個座標系的轉換，最后顯示在我們的屏幕上。TNH物理好資源網(原物理ok網)

通常來說，須要經過四個座標系的轉換。TNH物理好資源網(原物理ok網)

世界座標系TNH物理好資源網(原物理ok網)

描述現實世界中物體所處的三維座標。TNH物理好資源網(原物理ok網)

單反座標系TNH物理好資源網(原物理ok網)

以單反的光心為座標原點，x軸和y軸分別平行于圖象座標系的x軸和y軸，單反的光軸為z軸。TNH物理好資源網(原物理ok網)

圖象座標系TNH物理好資源網(原物理ok網)

以圖象平面（通常指傳感）的中心為座標原點，x軸和y軸分別平行于圖象平面的兩條垂直邊，用(x,y)表示其座標值，圖象座標系是用化學單位（比如毫米）表示象素在圖象中的位置。TNH物理好資源網(原物理ok網)

象素座標系TNH物理好資源網(原物理ok網)

以圖象平面左上角的頂點為原點，x軸和y軸分別平行于圖象坐標的x軸和y軸，用(u,v)表示其座標值。這個座標系也就是最終在我們手機上顯示的座標系。TNH物理好資源網(原物理ok網)

所以，假若我們假如我們想獲得象素點對應的三維坐標的話，就要按照象素座標系反推回單反座標系中。而怎樣反推就涉及到幾個座標系之間的轉換方式。TNH物理好資源網(原物理ok網)

已知一個現實世界中的物體點在世界座標系中的座標為(X,Y,Z)，單反座標系為(Xc,Yc,Zc)，圖象座標系中的座標為(x,y)，象素座標系上的座標為(u,v)TNH物理好資源網(原物理ok網)

象素座標系與圖象座標系之間的轉換為：TNH物理好資源網(原物理ok網)

其中u0,v0是圖象座標系原點在象素座標系中的座標，dx和dy分別是每位象素在圖象平面上x和y方向上的規格，這種值也被稱為圖象的內參矩陣，是可以通過API領到的。TNH物理好資源網(原物理ok網)

圖象座標系與單反座標系之間的轉換為：TNH物理好資源網(原物理ok網)

其中f為焦距，為何如此轉換是按照相像三角形定律得到的，如右圖所示：TNH物理好資源網(原物理ok網)

最后則是單反座標系與世界座標系的轉換關系：TNH物理好資源網(原物理ok網)

其中R為3x3的正交旋轉矩陣，t為三維平移向量，這幾個參數也被稱為單反的外參矩陣，也是可以領到的。TNH物理好資源網(原物理ok網)

在通常的應用中，我們只須要從象素座標系轉換到單反座標系就夠用了。TNH物理好資源網(原物理ok網)

基本知識都打算完畢，接下來看怎樣在上獲取象素點的三維座標。TNH物理好資源網(原物理ok網)

在Swift按照象素點估算出它基于單反的三維座標TNH物理好資源網(原物理ok網)

在Swift中啟動單反主要有以下三個步驟TNH物理好資源網(原物理ok網)

// 1. 發現 TruthDepth 相機
let videoDeviceDiscoverySession = AVCaptureDevice.DiscoverySession(deviceTypes: [.builtInTrueDepthCamera], mediaType: .video, position: .front)
// 2. 初始化輸入和輸出
let videoDeviceInput = try AVCaptureDeviceInput(device: videoDeviceDiscoverySession.devices.first!)
// 3. 給 session 添加輸出
let depthDataOutput = AVCaptureDepthDataOutput() session.addOutput(depthDataOutput) depthDataOutput.setDelegate(self, callbackQueue: dataOutputQueue)

由于我們設置了，所以單反只要捕捉到一幀深度圖都會反彈下邊這個函數TNH物理好資源網(原物理ok網)

func dataOutputSynchronizer(_ synchronizer: AVCaptureDataOutputSynchronizer, didOutput synchronizedDataCollection: AVCaptureSynchronizedDataCollection) {
        ...
        // 獲得相機內參數和對應的分辨率
        let intrinsicMartix = syncedDepthData.depthData.cameraCalibrationData?.intrinsicMatrix
        let refenceDimension = syncedDepthData.depthData.cameraCalibrationData?.intrinsicMatrixReferenceDimensions
        self.camFx = intrinsicMartix![0][0]
        self.camFy = intrinsicMartix![1][1]
        self.camOx = intrinsicMartix![0][2]
        self.camOy = intrinsicMartix![1][2]
        self.refWidth = Float(refenceDimension!.width)
        self.refHeight = Float(refenceDimension!.height)
        ...
}

在這個反彈函數里，我們可以獲得攝像頭的內參數，示例的程序中，只要觸摸預覽圖中某一個象素點，程序會調用下邊代碼塊輸出該象素點在單反座標系下的X,Y和Z的值。TNH物理好資源網(原物理ok網)

    override func touchesBegan(_ touches: Set, with event: UIEvent?) {
        let touchPoint = (touches as NSSet).allObjects[0] as! UITouch
        // 獲得像素坐標系的坐標
        let coord = touchPoint.location(in: self.preview)
        let viewContent = self.preview.bounds
        let xRatio = Float(coord.x / viewContent.size.width)
        let yRatio = Float(coord.y / viewContent.size.height)
        // 獲得觸摸像素點的深度值 Z，單位為 cm
        let realZ = getDepth(from: depthPixelBuffer!, atXRatio: xRatio, atYRatio: yRatio)
        // 獲得對應的 X 和 Y 值，計算公式其實就是兩個坐標轉換矩陣之間相乘后的結果
        // 像素 -> 圖像 -> 相機坐標系
        let realX = (xRatio * refWidth! - camOx!) * realZ / camFx!
        let realY = (yRatio * refHeight! - camOy!) * realZ / camFy!
        DispatchQueue.main.async {
            self.touchCoord.text = String.localizedStringWithFormat("X = %.2f cm, Y = %.2f cm, Z = %.2f cm", realX, realY, realZ)
        }
    }

示例程序的療效圖如下：TNH物理好資源網(原物理ok網)

image.pngTNH物理好資源網(原物理ok網)

這兒輸出的是黑色點對應的X,Y,Z值，完整代碼戳這兒。TNH物理好資源網(原物理ok網)

參考鏈接TNH物理好資源網(原物理ok網)

[1]手臂辨識技術解析TNH物理好資源網(原物理ok網)

[2]Quoar:WhatisthefloodinXfor?TNH物理好資源網(原物理ok網)

[3]世界，單反，圖象，象素座標系之間的關系TNH物理好資源網(原物理ok網)

[4]Guide-AppleTNH物理好資源網(原物理ok網)

[5]PhotoandVideoUsingDepthTNH物理好資源網(原物理ok網)

久久天天躁狠狠躁夜夜躁,国产精品入口福利,97久久精品人人爽人人爽蜜臀 ,中文字幕国产精品一区二区

當前位置首頁 > 信息公告

[AR/MR基礎]借助iPhoneX的深度單反(TruthDepth

發表評論