Effect of Learning Data on the Semantic Segmentation of Railroad Tunnel Using Deep Learning

Young-Moo Ryu; Byung-Kyu Kim; Jeongjun Park

doi:10.7843/kgs.2021.37.11.107

Preview

Journal of the Korean Geotechnical Society. 30 November 2021. 107-118
https://doi.org/10.7843/kgs.2021.37.11.107

Effect of Learning Data on the Semantic Segmentation of Railroad Tunnel Using Deep Learning

딥러닝을 활용한 철도 터널 객체 분할에 학습 데이터가 미치는 영향

Young-Moo Ryu¹

Byung-Kyu Kim²

Jeongjun Park³^*

유 영무¹

김 병규²

박 정준³^*

¹Post-doctoral Researcher, Korea Railroad Research Institute

²Senior Researcher, Korea Railroad Research Institute

³Member, Senior Researcher, Korea Railroad Research Institute

¹비회원, 한국철도기술연구원 박사후연수연구원

²비회원, 한국철도기술연구원 선임연구원

³정회원, 한국철도기술연구원 선임연구원

^{*Corresponding Author}

ABSTRACT

Scan-to-BIM can be precisely modeled by measuring structures with Light Detection And Ranging (LiDAR) and building a 3D BIM (Building Information Modeling) model based on it, but has a limitation in that it consumes a lot of manpower, time, and cost. To overcome these limitations, studies are being conducted to perform semantic segmentation of 3D point cloud data applying deep learning algorithms, but studies on how segmentation result changes depending on learning data are insufficient. In this study, a parametric study was conducted to determine how the size and track type of railroad tunnels constituting learning data affect the semantic segmentation of railroad tunnels through deep learning. As a result of the parametric study, the similar size of the tunnels used for learning and testing, the higher segmentation accuracy, and the better results when learning through a double-track tunnel than a single-line tunnel. In addition, when the training data is composed of two or more tunnels, overall accuracy (OA) and mean intersection over union (MIoU) increased by 10% to 50%, it has been confirmed that various configurations of learning data can contribute to efficient learning.

Keywords

Deep learning

Point cloud data

Railroad tunnel

Scan-to-BIM

Semantic segmentation

Scan-to-BIM은 라이다(Light Detection And Ranging, LiDAR)로 구조물을 계측하고 이를 바탕으로 3D BIM(Building Information Modeling) 모델을 구축하는 방법으로 정밀한 모델링이 가능하지만 많은 인력과 시간, 비용이 소모된다는 한계를 가진다. 이러한 한계를 극복하기 위해 포인트 클라우드 데이터를 대상으로 딥러닝(Deep learning) 알고리즘을 적용하여 구조물의 객체 분할(Semantic segmentation)을 수행하는 연구들이 진행되고 있으나 학습 데이터에 따라 객체 분할 정확도가 어떻게 변화하는지에 대한 연구는 미흡한 실정이다. 본 연구에서는 딥러닝을 통한 철도 터널의 객체 분할에 학습 데이터를 구성하는 철도 터널의 크기, 선로 유형 등이 어떤 영향을 미치는지 확인하기 위해 매개변수 연구를 수행하였다. 매개변수 연구 결과, 학습과 테스트에 사용한 터널의 크기가 비슷할수록, 단선 터널보다는 복선 터널로 학습하는 경우에 더 높은 객체 분할 성능을 보였다. 또한, 학습 데이터를 두 가지 이상의 터널로 구성하면 전체 정확도(Overall Accuracy, OA)와 MIoU(Mean Intersection over Union)가 적게는 10%에서 많게는 50%가량 증가하였는데 이로부터 학습 데이터를 다양하게 구성하는 것이 효율적인 학습에 기여할 수 있음을 확인하였다.

MAIN

1. 서 론
2. 배경이론
2.1 포인트 클라우드
2.2 포인트넷(PointNet)
3. 캐드 모델링을 활용한 3D 포인트 클라우드 학습 DB 구축
3.1 3D 캐드를 활용한 터널 모델링
3.2 3D 캐드 모델의 포인트 클라우드 데이터 변환
3.3 학습 DB 구축을 위한 카테고리 구분
4. 포인트넷 기반의 터널 객체 분할 인식 파라미터 연구
4.1 동일한 터널 데이터를 사용한 경우
4.2 서로 다른 크기의 복선 터널 데이터를 사용한 경우
4.3 서로 다른 유형의 터널 데이터를 사용한 경우
4.4 다양한 데이터를 사용한 경우
5. 결 론

1. 서 론

과학기술이 발전함에 따라 AICBM(Artificial intelligent, IoT, Cloud, Big data and Moblie) 기술을 사용하는 것이 점점 더 저렴해지고 편리해지면서 과거보다 더 쉽게 현실 세계로부터 데이터를 취득하고, 디지털 공간에서 이를 분석하고 시뮬레이션할 수 있게 되었다. 이러한 기술을 일컬어 디지털 트윈(Digital twin)이라 한다. 디지털 트윈은 2017년부터 2019년까지 3년 동안 가트너가 선정한 10대 전략기술에 포함되어 세계적으로 주목받고 있으며 국내에서도 정부의 ‘한국판 뉴딜’ 정책의 10대 대표과제 중 하나로 선정되었다(Ministry of Economy and Finance, 2020).

건설 분야의 관점에서 BIM(Building Information Modeling)은 디지털 트윈을 적용한 기술의 대표적인 예라고 할 수 있다. BIM은 구조물의 물리적, 기능적 특성을 디지털로 구현한 것으로, 건설 프로젝트 전 생애주기 동안 설계 검토, 시뮬레이션을 통한 공정관리, 유지관리 등 다양한 업무에 활용할 수 있다(Kreider et al., 2010; Hergunsel, 2011). 이러한 장점으로 인해, 전 세계적으로 BIM 도입이 증가하는 추세 속에 국내에서도 턴키 및 공공 도로사업의 BIM 설계 의무화를 통해 BIM 도입을 가속화하고 있다(Ministry of Land, Infrastructure and Transport, 2018). BIM 도입 가속화는 BIM 설계 정착으로 이어지며 나아가 향후 시설물의 유지관리도 BIM 기반 체계로 변환될 것임을 의미한다. 그러나 BIM 도입 이전에 시공된 구조물의 유지관리에 BIM을 활용하기 위해서는 먼저 구조물을 역설계하여 3D BIM 모델을 구축하는 과정이 필요하다. 그러나 역설계를 통한 BIM 모델링은 실측 및 도면 재작성 과정에 많은 비용과 시간이 소모되고 전문 인력과 기술을 필요로 하는 문제가 있어 이를 해결하고자 전문적인 실측 능력을 요구하지 않아도 도면 작성이 가능한 Scan-to-BIM이 활용된다(Park, 2021).

Scan-to-BIM 과정은 라이다(Light Detection And Ranging, LiDAR)로 구조물을 계측하는 것으로 시작된다. 라이다는 정밀한 계측이 가능하여 구조물의 변상상태를 평가하는데 활용되기도 하고 구조물을 여러 방향에서 계측하고 이를 하나로 정합하는 과정을 통해 비교적 넓은 범위의 3차원 정보를 고밀도의 포인트 클라우드 데이터(Point Cloud Data, PCD)의 형태로 획득할 수 있어 정밀한 3D 모델을 구축하는데 많이 활용되고 있다(Hong et al., 2012; Park and Lee, 2015; Lee and Sim, 2021). 그러나 이렇게 취득한 방대한 양의 포인트 클라우드 데이터는 단순히 시각적으로 구조물의 3차원 형상을 볼 수 있게 해줄 뿐 각각의 점이 구조물의 어떤 구성요소에 포함되는지는 알 수 없다. 따라서 BIM 기반 유지관리에 포인트 클라우드 데이터를 효과적으로 활용하기 위해서는 각각의 점이 구조물의 구성요소 중 어디에 해당하는지를 수작업으로 분류해내는 과정이 필요하며, 분류된 점들을 구조물로 3D BIM 모델을 구축하게 된다. 현재는 이러한 모든 과정이 인력에 의한 수작업을 통해 이루어지게 되며, 단순하고 반복적인 업무의 연속으로, 많은 인력과 시간, 비용이 소모된다.

이러한 한계를 극복하기 위해 포인트 클라우드에서 3D 모델 생성을 자동화하려는 연구들이 진행되고 있다. 그 중에 하나로 딥러닝을 통해 여러 가지 객체들이 혼재하는 포인트 클라우드 데이터에서 각각의 서로 다른 객체들을 구분해내는 객체 분할(Semantic segmentation)에 대한 연구들이 수행되고 있으며(Qi et al., 2017; Landrieu and Simonovsky 2018; Wang et al., 2019; Rao et al., 2021), 건설 분야에도 이러한 연구들을 바탕으로 하여 딥러닝을 통해 구조물을 객체 분할하는 연구들이 수행되고 있다(Soilán et al., 2020; Kim et al., 2020; Meng, 2020; Park, 2021; Lee et al., 2021). 건설 분야에서의 이러한 연구들은 모두 테스트 결과를 향상시키기 위한 다양한 방법들을 다루고 있다. 그러나 건설 분야에서의 연구들은 딥러닝 알고리즘을 구조물에 적용하는 것에 초점이 맞추어져 있으며, 딥러닝의 학습 데이터에 따라서 구조물의 객체 분할의 정확도가 어떻게 변하는지에 대한 연구는 이루어지지 않았다.

본 연구에서는 철도 터널의 3차원 포인트 클라우드 데이터를 대상으로 딥러닝 알고리즘 적용을 통해 자동화된 객체 분할에 대한 연구를 진행하고자 하며, 이때 학습 데이터로 사용한 철도 터널의 단면의 크기, 선로 유형, 종류 등에 따라 객체 분할 정확도의 변화를 살펴보고자 매개변수 연구를 수행하였다. 이를 통해 각각의 요인들이 테스트 정확도에 어떠한 영향을 미치는지 검토하고 철도 터널의 객체 분할을 수행하는데 효율성을 높이기 위해 필요한 학습 데이터 구성 조건에 대해 기술하였다.

2. 배경이론

2.1 포인트 클라우드

포인트 클라우드는 3차원 공간의 데이터 포인트 군집을 의미하는데 일반적으로 라이다와 같은 3D 스캐너를 통해 생성된다. 3D 스캐너는 구조물의 외부 표면에서 다수의 포인트를 측정하는데 이렇게 측정된 데이터는 점의 형태로 기록되며 각각의 포인트는 3차원 위상정보(x, y, z 좌표)와 색상 정보(R, G, B)를 포함한다. 본 연구에서는 매개변수 연구를 위해 여러 종류의 철도 터널에 대한 포인트 클라우드 데이터가 필요하였다. 그러나 현실적으로 운영 중인 철도 터널을 대상으로 다수의 계측을 진행하기는 매우 어렵기 때문에 3D 캐드(CAD) 모델을 포인트 클라우드 데이터로 변환하는 방법을 사용하였다. 이에 대한 자세한 설명은 3장에 서술하였다.

2.2 포인트넷(PointNet)

본 연구에서는 2.1에서 설명한 포인트 클라우드를 활용하여 객체 분할을 하기 위한 알고리즘으로 포인트넷을 사용하였다. 포인트넷은 포인트 클라우드를 학습하여 3차원 객체의 분류(classification) 또는 분할(segmentation)하는 딥러닝의 기법이다(Qi et al., 2017). 포인트넷은 기존에 포인트 클라우드를 활용하기 위해 이미지 그리드(image grid) 또는 3D 복셀(voxel) 형식의 규칙적인 형식의 데이터로 변환하던 과정을 거치지 않고 포인트 클라우드 자체를 학습 데이터로 활용할 수 있다. 이로 인해 변환 과정에서 발생할 수 있는 데이터 용량 증가, 데이터 왜곡 등의 문제를 극복할 수 있다는 장점이 있다. 이러한 장점은 크기가 큰 토목 구조물을 대상으로 객체 분할을 수행하는데 효과적일 것으로 판단되어 본 연구를 수행하는데 활용하였다. 포인트넷의 아키텍쳐는 Fig. 1과 같다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F1.jpg

Fig. 1

PointNet architecture (Qi et al., 2017)

포인트넷의 아키텍쳐를 살펴보면 우선, 입력 데이터인 포인트 클라우드를 T-Net을 이용해 3×3 변환 행렬(transform matrix)을 출력하고 여기에 다시 포인트 클라우드를 곱해준다. 이 과정을 통해 포인트 클라우드는 이동과 회전에 영향을 받지 않게 된다(Jaderberg et al., 2015). 이후에 다층 퍼셉트론(multi layer perceptron, mlp)을 통해 포인트 클라우드를 64차원으로 늘리고 특성 변환(feature transform) 과정을 통해 64×64 변환 행렬을 계산하여 지역 특징(local feature)을 추출한다. 추출된 지역 특징은 1024차원의 특징점으로 다층 퍼셉트론을 활용해 생성하고 최대 풀링(max pooling)을 수행하여 전역 특징(global feature)을 도출한다. 이렇게 도출된 64차원의 지역 특징과 1024차원의 전역 특징을 합해주고 다층 퍼셉트론을 거쳐 산출 점수(output score)를 결정하여 각 3차원 좌표가 의미하는 바를 결정한다(Qi et al., 2017).

3. 캐드 모델링을 활용한 3D 포인트 클라우드 학습 DB 구축

학습 데이터의 종류와 그 구성의 변화에 따른 철도 터널 객체 분할 인식 정확도의 변화를 확인하기 위해서는 우선 학습 데이터 구축에 사용할 다양한 형상의 철도 터널 포인트 클라우드 데이터가 필요하다. 일반적으로 구조물의 포인트 클라우드 데이터는 라이다 계측을 통해 취득하게 된다. 그러나 라이다 계측을 통해 실제 운영 중인 철도 터널의 포인트 클라우드 데이터를 확보하려면 철도의 운영을 중단시켜야 한다는 문제가 있으며 계측에도 많은 시간과 비용을 필요로 한다. 더욱이 본 연구의 목적을 위해서는 다양한 형상의 터널을 대상으로 계측을 수행하여야 하는데 이는 현실적으로 불가능하다. 이런 문제를 극복하고자 3D 캐드를 활용하여 터널을 모델링하여 학습 DB 구축에 활용하는 방안을 제안하였다.

3.1 3D 캐드를 활용한 터널 모델링

3D 캐드를 활용한 터널 모델링은 라이다 계측에 소요되는 인력과 시간을 절약하고 터널 운영에 지장을 주지 않으며 원하는 단면의 형태를 고려하여 모델링이 가능하기 때문에 본 연구를 수행하는데 적합한 방식이며, 모델링은 NATM 공법으로 건설된 철도 터널을 대상으로 하였다. 터널의 단면 크기와 형상이 철도 터널의 객체 분할 정확도에 어떤 영향을 미치는지 알아보고자 단면 크기가 서로 다른 세 가지 복선 터널과 선로가 하나인 단선 터널을 모델링하였다. 각각의 터널은 총 여섯 가지 카테고리로 구성되는데 각각 라이닝(Lining), 배수로(Drain), 선로(Rail), 침목(Sleeper), 바닥부(Bottom), 전선(Wire)으로 이루어졌다. 복선 터널과 단선 터널의 형상은 Fig. 2와 같으며 단면의 치수는 Table 1과 같다. 복선 터널은 단면의 크기가 작은 것부터 순서대로 소형(Double-S), 중형(Double-M), 대형(Double-L)으로 구분하여 명명하였다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F2.jpg

Fig. 2

Tunnel cross-section modeled by 3D CAD

Table 1.

The cross-sectional dimensions of the tunnel

Tunnel type	Double-S	Double-M	Double-L	Single
Height (H, m)	7.1	8.18	9.95	7.6
Width (W, m)	10.4	12.0	16.0	6.55
Bottom (B, m)	8.2	9.9	13.8	4.3
Distance between the center of the track (D, m)	4.1	5.1	7.3	-
Approximate area (H×W, m²)	73.8	98.2	159.2	49.8

3.2 3D 캐드 모델의 포인트 클라우드 데이터 변환

앞서 제작한 3D 캐드 모델을 딥러닝에 활용하기 위한 학습 DB를 구축하기 위해서는 먼저 포인트 클라우드 데이터로 변환하는 과정이 필요하다. 이를 위해 Meshlab 프로그램을 사용하였으며 3D 캐드 모델의 단면에서 점들을 추출하는 방식을 통해 포인트 클라우드 데이터 변환을 하였다. 점들을 추출하는 방법으로는 Poisson-disk sampling 방식을 사용하였다. 무작위로 샘플을 추출할 경우 단면 내에서 추출된 점들 사이의 거리를 고려하지 않고 임의로 추출되기 때문에 밀도가 높은 곳과 낮은 곳이 생길 수 있어 균질한 데이터를 얻기 어려우나 Poisson-disk sampling 방식은 점들을 랜덤하게 배치하면서도 점들이 특정 거리보다 가까이 있지 않도록 제한하는 방식으로 추출하기 때문에 균질한 데이터를 얻을 수 있다(Robert, 1986).

실제 라이다 계측 시에는 구조물의 표면이 계측되는데 이 과정에서 Fig. 3의 (a)와 같이 노이즈가 발생하거나 오차로 인해 단면이 수 mm의 두께를 가지는 점군의 형태로 표현되게 된다. 그러나 3D 캐드 모델에서 포인트 클라우드 데이터를 변환하는 과정에서는 이러한 문제가 없이 Fig. 3의 (b)와 같이 매끄러운 형태의 데이터로 변환할 수 있다는 장점이 있다. 본 연구의 목적은 학습 데이터를 구성하는 터널 단면의 크기와 선로 유형에 따라 철도 터널의 객체 분할 정확도에 어떠한 영향을 미치는지를 확인하는 것으로 실제 계측 데이터가 아닌 3D 캐드 모델에서 변환한 데이터를 사용하여도 연구 결과의 도출에 문제가 없기에 해당 방식으로 학습 DB를 구축하였다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F3.jpg

Fig. 3

Difference of PCD between the measured tunnel and 3D CAD model

3.3 학습 DB 구축을 위한 카테고리 구분

3.2와 같은 과정을 거쳐 변환된 포인트 클라우드 데이터를 딥러닝에 활용하기 위해서는 터널 전체 포인트 클라우드 데이터를 각각의 카테고리별 포인트 클라우드 데이터로 분리해내는 라벨링(labeling) 과정이 필요하다. 이를 위해 RIEGL사의 포인트 클라우드 데이터 데이터 처리 프로그램인 Riscan Pro를 사용하였다.

학습 DB 구축을 위해 먼저 10m 단위로 터널을 구분하여 하나의 데이터로 하였다. 이는 학습 데이터의 수에 따른 영향을 보기 위함으로 연장이 400m인 네 터널은 각각 40개의 데이터로 분할되었다. 10m 단위로 분할된 포인트 클라우드 데이터에서 각각의 카테고리에 해당하는 점군을 수작업으로 선택하고 분리하여 Fig. 4와 같이 카테고리별로 분류하였다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F4.jpg

Fig. 4

Categorize PCD through labeling

라벨링까지 완료된 데이터는 마지막으로 딥러닝에 적용하기 위해 텍스트 파일의 형태로 추출하였다. 이때 각각의 점들은 위치 정보인 x, y, z 좌표값과 색상 정보인 RGB값을 포함한다. 본 연구에서는 터널 단면의 크기와 형상에 대한 영향을 검토하므로 이와 관계없는 변수인 색상에 의해 영향을 받지 않도록 3D 캐드로 구축한 모델에 모두 동일하게 회색을 부여하여 추출하였다. 라벨링을 통해 카테고리별로 분류되어 추출된 포인트들은 입력 데이터로서 학습에 활용되기도 하고, 테스트 데이터로 활용될 때에는 객체 분할의 결과가 참인지 거짓인지를 평가하는 기준이 되기도 한다.

4. 포인트넷 기반의 터널 객체 분할 인식 파라미터 연구

4.1 동일한 터널 데이터를 사용한 경우

학습과 테스트에 동일한 터널을 사용하는 것과 학습 데이터의 수가 터널 객체 분할 정확도에 미치는 영향을 확인하고자 Table 2의 Case 1, 2를 수행하였다. Case 1과 2는 학습과 테스트에 각각 복선 소형과 단선 터널을 사용하였고 학습 데이터의 수를 하나부터 증가시켜가며 해석을 수행하여 구성요소를 얼마나 잘 구분하여 인식하였는지를 OA(Overall Accuracy)와 MIoU(Mean Intersection over Union)의 변화를 통해 확인하였다. OA는 테스트 데이터에 포함된 전체 점들 가운데 정확하게 인식하여 분류해낸 점이 얼마나 되는지를 의미하는 것으로 식 (1)과 같이 표현된다. MIoU는 각각의 카테고리별 IoU(Intersection over Union)의 평균값이며 식 (2)와 같이 표현된다. IoU는 객체 분할 성능을 평가하는데 일반적으로 사용되는 도구로서 테스트에 의해 카테고리로 예측된 점들 중에 옳게 예측된 점의 비율을 의미하는 것이다. 정확도(accuracy)는 계산 과정에서 해당 카테고리로 라벨링된 점의 개수를 분모로 가지지만 IoU는 참, 거짓에 관계없이 테스트 결과 해당 카테고리로 분류된 점의 개수를 분모로 가진다.

Table 2.

Learning and test data for each case

Case	Learning data	Test data
1	Double-S	Double-S
2	Single	Single
3	Double-M	Double-S
4	Double-L	Double-S
5	Double-S	Double-M
6	Double-L	Double-M
7	Double-S	Double-L
8	Double-M	Double-L
9	Single	Double-S
10		Double-M
11		Double-L
12	Double-S	Single
13	Double-M
14	Double-L
15	Double-M, L	Double-S
16	Double-S, L	Double-M
17	Double-S, M	Double-L
18	Double-M, L, Single	Double-S
19	Double-S, L, Single	Double-M
20	Double-S, M, Single	Double-L

(1)

O A = \frac{\sum_{i = 1}^{n} T P_{i}}{\sum_{i = 1}^{n} G T_{i}}

(2)

M I o U = \frac{\sum_{i = 1}^{n} \frac{T P_{i}}{(G T_{i} + F P_{i})}}{n}

여기서, n은 분류한 카테고리의 수로 앞서 정의한 바와 같이 6이다. GT, TP, FP는 각각 Ground truth, True-positive, False-positive에 속하는 포인트의 개수이다. GT는 해당 카테고리로 정의된 모든 점의 수를 의미한다. TP는 해당 카테고리로 분류된 점들 중 실제로 참인 점의 수를 의미한다. FP는 다른 카테고리에 해당하는 점이지만 해당 카테고리로 잘못 분류된 점의 수를 의미한다. 예를 들어 설명하면, 라벨링에 의해 라이닝으로 정의된 점의 수가 100개라면 GT는 100이고, 테스트 결과 라이닝으로 분류된 점이 120개이고 이 중에 실제로 라이닝인 점이 80개 그렇지 않은 점이 40개라면 TP는 80, FP는 40이 되며 이 경우 정확도는 80%, IoU는 57.1%가 된다.

Case 1, 2를 학습 데이터의 수를 늘려가며 진행한 결과는 Fig. 5와 같다. 테스트 결과, 학습 데이터를 하나만 사용해도 두 가지 case 모두 OA와 MIoU가 90%를 초과하는 것으로 나타나 학습과 테스트에 동일한 터널을 사용할 경우, 학습 데이터 수가 적어도 높은 분류 성능을 보이는 것을 알 수 있었다. 또한, 학습 데이터의 수가 30개에 이르면 OA는 100%에 근접하며 MIoU도 97~98% 정도로 수렴하는 것을 확인하였다. 이를 근거로 하여 이후에 수행할 Case의 학습 데이터 수는 모두 30개로 동일하게 적용하여 다른 변수를 고려할 때 영향을 미치지 않도록 제한하였다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F5.jpg

Fig. 5

Changes in results according to the number of learning data

4.2 서로 다른 크기의 복선 터널 데이터를 사용한 경우

학습 데이터와 테스트 데이터에 모두 복선 터널을 사용하나 두 터널의 단면 크기가 다른 경우에 객체 분할에 어떤 영향이 있는지 살펴보기 위해 Case 3부터 Case 8까지 수행하였다. 테스트 결과는 Table 3과 같이 정리하였는데 학습과 테스트에 같은 데이터를 사용한 경우와 비교하기 위해 4.1절의 Case 1에서 학습 데이터의 수가 30개인 경우의 결과를 함께 나타내었다. 표의 내용 중 근사 면적(approximate area)의 비율은 학습 데이터와 테스트 데이터에 사용된 터널의 근사 면적 사이의 비율을 의미하며 이는 둘 사이에서 상대적으로 작은 값을 큰 값으로 나눈 값이다. 이때, 터널의 근사 면적은 Table 1에 나타낸 것과 같이 터널의 가로폭과 높이를 곱한 값을 의미한다.

Table 3.

Test results from Case 1 to Case 8 according to the ratio of approximate area (except for Case 2)

Ratio of approximate area	Case	Learning data	Test data	Overall accuracy (%)	MIoU (%)
1	1	Double-S	Double-S	99.8	97.7
0.752	3	Double-M	Double-S	87.0	62.5
0.752	5	Double-S	Double-M	93.9	73.3
0.617	6	Double-L	Double-M	93.5	77.1
0.617	8	Double-M	Double-L	80.6	51.5
0.464	4	Double-L	Double-S	84.7	52.9
0.464	7	Double-S	Double-L	65.0	31.7

Table 3의 결과값을 통해 알 수 있듯이, 학습과 테스트에 동일하게 복선 소형 터널을 사용한 Case 1의 경우는 OA와 MIoU가 모두 100%에 가까운 결과를 보였으나, 학습에 각각 복선 중형과 복선 대형을 사용한 Case 3과 4는 OA는 각각 87.0%와 84.7%, MIoU는 62.5%와 52.9%로 객체 분할 성능이 감소한 것을 확인할 수 있었다. 이를 통해 기존에 Soilán et al.(2020)에서와 같이 학습과 테스트에 동일한 터널을 사용하여 객체 분할 성능을 도출하는 것은 정확도 결과가 과대평가될 수 있음을 알 수 있다. 또한 새로운 터널에 대해 객체 분할을 수행할 때마다 해당 터널 데이터로 새로 학습을 진행해야 하므로 시간이 소요되어 객체 분할을 적용하기에 수고로움이 있음을 알 수 있다.

Fig. 6은 근사 면적 사이의 비율을 가로축으로 하였을 때의 Case 3부터 8까지의 테스트 결과를 도시한 것이다. 테스트 결과, 터널 사이의 근사 면적 차이가 가장 적은 복선 소형과 복선 중형을 학습과 테스트에 각각 활용한 Case 3과 Case 5의 평균 성능이 가장 좋았다. 반면에 근사 면적간의 차이가 가장 큰 복선 소형과 복선 대형을 사용한 경우인 Case 4와 Case 7의 평균 정확도는 가장 낮았다. 이로부터 서로 다른 크기의 복선 터널 데이터를 사용할 경우, 둘 사이의 크기가 비슷할수록 객체 분할 인식의 정확도가 높아지는 것을 알 수 있었다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F6.jpg

Fig. 6

Overall accuracy and MIoU when using different double-track tunnel data for learning and test

4.3 서로 다른 유형의 터널 데이터를 사용한 경우

학습 데이터와 테스트 데이터에 복선 터널과 단선 터널과 같이 그 유형이 다른 터널을 사용하는 경우 객체 분할 인식에 어떤 영향이 있는지 살펴보기 위해 Case 9부터 Case 14까지 수행하였다. 테스트 결과는 Fig. 7과 같다.

Fig. 7의 (a)를 통해 알 수 있듯이 단선 터널 데이터로 학습하여 복선 터널을 테스트한 경우는 모두 MIoU가 50%에 미치지 못하는 수준의 낮은 정확도를 보였다. 반면에 복선 터널 데이터를 학습하여 단선 터널을 테스트한 경우에는 Fig. 7의 (b)와 같이 상대적으로 높은 정확도를 보였다. 이러한 차이가 발생한 이유는 단선과 복선의 선로와 침목 데이터의 포인트 수에 있다. 각각의 터널별 선로와 침목 데이터 포인트 수의 합을 단선 터널인 경우를 1로 하여 정규화하면 Table 4와 같다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F7.jpg

Fig. 7

Overall accuracy and MIoU when using different track type of tunnel for learning and test

Table 4.

Total number of point data on rail and sleeper for each tunnel normalized based on a single-track tunnel

Single	Double-S	Double-M	Double-L
1	1.75	1.84	1.81

Table 4를 통해 알 수 있듯이 선로와 침목의 데이터 포인트 수는 복선이 단선에 비해 약 1.8배 가량 더 많은 것을 알 수 있다. 같은 복선 터널 사이의 선로와 침목 포인트 개수의 합계가 조금씩 다른 것은 3D 캐드 모델에서 포인트 클라우드로 변환하는 과정에서 샘플링된 포인트의 개수에 차이가 발생하기 때문이다. Fig. 8은 앞서 4.2절에서와 같이 학습과 테스트 터널 사이의 근사 면적 비율을 고려하였을 때 선로와 레일에 대한 IoU의 평균을 나타낸 것이다. 이를 통해서 알 수 있듯이 근사 면적 비율이 동일한 경우 모두 복선 터널로 학습하여 단선 터널을 테스트한 것의 결과가 더 높은 것을 알 수 있다. 또한, 이 경우에도 학습 데이터와 테스트 데이터의 단면의 크기가 유사할수록 정확도가 높게 나타났는데 이를 통해 정확도에 단면의 크기가 영향을 미친다는 것을 다시 한번 확인할 수 있었다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F8.jpg

Fig. 8

MIoU of rail and sleeper according to the ratio of approximate area

선로와 침목에 대한 객체 분할 인식 정확도의 상승은 Fig. 9에서 볼 수 있듯이 단선 터널 데이터로 학습하여 복선을 테스트한 Case 10에 비해 복선 터널 데이터로 학습하여 단선을 테스트한 Case 13이 선로와 침목을 인식하는데 오답률이 더 적어 Ground truth에 가까움을 알 수 있으며 이로 인해 선로와 침목 주위에 위치한 배수로와 바닥부에 대한 오답률 역시 함께 감소하여 전체적으로 정확도가 상승하는 결과를 보였다.

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F9.jpg

Fig. 9

Result of the semantic segmentation

4.4 다양한 데이터를 사용한 경우

학습에 두 가지 이상의 데이터를 사용할 경우의 정확도 변화 양상을 확인하고자 복선 터널 세 가지를 대상으로 테스트를 수행하였다. 테스트는 Case 15부터 Case 20까지 총 여섯 가지 경우에 대해 수행하였다. Case 15, 16, 17은 테스트에 사용한 터널을 제외한 나머지 복선 터널을 학습하여 테스트하였고 Case 18, 19, 20은 단선 터널 데이터까지 추가하여 학습하였다. 학습 데이터에 사용되는 터널의 가지 수가 늘어나더라도 학습 데이터의 수는 30개를 유지하여 학습 데이터 양 증가에 따른 정확도 증가를 배제하였다. 각각의 복선 터널의 학습 데이터에 따른 테스트 결과는 아래 Table 5에 정리하였고 학습 데이터에 사용한 터널의 수와 정확도의 변화를 Fig. 10과 같이 도시하였다. Fig. 10에서 학습에 사용한 터널의 수가 1로 표기된 경우는 학습에 테스트 데이터를 제외한 나머지 터널로 학습한 경우에 대한 평균값이다. 예를 들어 설명하면, Fig. 10의 (a)의 가로축 1에 해당하는 값은 각각 Table 5의 학습 데이터가 M, L, Single일 때의 Test S의 OA와 MIoU의 평균값을 의미한다.

Table 5.

Test results of the double-track tunnel by each learning data

Learning data	Test S		Test M		Test L
Learning data	OA (%)	MIoU (%)	OA (%)	MIoU (%)	OA (%)	MIoU (%)
S	-	-	93.9	73.3	65.0	31.7
M	87.0	62.5	-	-	80.6	51.5
L	84.7	52.9	93.5	77.1	-	-
Single	64.2	48.8	78.7	47.3	59.4	37.6
S, M	-	-	-	-	99.5	84.0
S, L	-	-	99.1	91.3	-	-
M, L	94.5	76.5	-	-	-	-
S, M, Single	-	-	-	-	99.4	85.9
S, L, Single	-	-	98.7	91.6	-	-
M, L, Single	97.4	85.7	-	-	-	-

※ S: Double-S, M: Double-M, L: Double-L

https://cdn.apub.kr/journalsite/sites/kgs/2021-037-11/N0990371109/images/kgs_37_11_09_F10.jpg

Fig. 10

Overall accuracy and MIoU according to the number of tunnel types used for learning

테스트 결과, 한 가지 종류의 터널만 학습에 사용한 경우보다 두 종류의 터널을 학습에 사용한 경우에 객체 분할 인식 정확도가 급격히 증가하는 것을 확인할 수 있었다. 세 가지 복선 터널 모두에서 Overall accuracy는 약 10~30%가량 증가하였고 MIoU는 20~45%가량 증가하였다. 또한, 복선 터널과는 다른 유형인 단선 터널을 학습 데이터에 추가하였을 경우 두 가지 복선 터널만을 학습했을 때와 비교해 적게는 1~2%, 많게는 8~9%가량 객체 분할 정확도가 증가하였다. 이러한 결과로부터 학습 데이터의 수가 충분할 경우에 학습 데이터로 여러 종류의 터널을 활용할수록 객체 분할 인식 적용성 증대될 것이라는 결론을 얻을 수 있었다.

5. 결 론

본 논문에서는 서로 다른 학습 데이터 조건에서 터널의 객체 분할 인식을 수행하여 각각의 정확도를 비교하는 매개변수 연구를 수행하였다. 매개변수 연구 결과로부터 학습과 테스트에 동일한 터널을 사용하는 것은 해당 알고리즘의 객체 인식 성능을 평가하는데 한계가 있음을 증명하였으며 테스트 결과에 신뢰성을 확보할 수 있을만큼 학습 데이터 수를 충족하였다면 학습 데이터의 종류를 다양하게 할수록 효율적인 터널 객체 분할 인식이 가능함을 알 수 있었다. 연구 수행 결과를 종합해보면 다음과 같다.

(1) 학습과 테스트에 동일한 터널 데이터를 사용하는 경우 하나의 학습 데이터만으로도 OA와 MIoU가 모두 90%를 초과하는 결과를 보였다. 그러나 학습과 테스트에 사용한 터널의 단면의 크기가 서로 다른 경우에는 OA와 MIoU가 각각 13~15%, 35~45% 가량 감소하는 모습을 보였다. 이를 통해 학습과 테스트에 동일한 데이터를 사용하여 객체를 분할 인식하는 방법은 새로운 형상의 터널을 대상으로 객체 분할을 수행할 때마다 새롭게 학습 DB를 구축해야 하는 번거로움이 있어 범용성이 떨어지는 것을 확인할 수 있었다. 또한, 학습과 테스트에 사용한 터널의 단면 크기가 서로 다른 경우에는 각 터널의 근사 면적이 유사할수록 객체 분할 인식의 정확도가 증가하는 경향을 보였다.

(2) 학습과 테스트에 복선 터널과 단선 터널을 각각 활용한 경우 서로 다른 크기의 복선 터널을 활용한 경우에 비해 정확도가 감소하는 것을 확인하였다. 단선 터널을 학습하여 복선 터널을 테스트하는 경우, OA와 MIoU가 모두 5~25%가량 감소하는 것을 확인할 수 있었다. 다만, 복선 터널을 학습하여 단선 터널을 테스트하는 경우는 상대적으로 높은 정확도를 보였는데 이는 복선 터널의 선로와 침목에 대한 학습 데이터 양이 단선 터널의 약 1.8배 수준이기에 선로와 침목에 대한 객체 분할 인식 정확도가 증가되었고 이와 함께 선로와 침목 주변의 배수로와 바닥부에 대한 정확도도 증가하며 전체적으로 정확도가 증가한 것으로 판단하였다.

(3) 학습 데이터로 두 종류 이상의 터널 데이터를 활용할 경우 객체 분할 인식 정확도가 크게 증가하는 것을 확인하였다. 하나의 터널을 학습한 경우보다 두 종류의 터널을 학습한 경우에 OA와 MIoU가 적게는 10%에서 많게는 50%가량 증가하였다. 또한, 학습 데이터에 테스트 데이터와 선로의 수가 다른 단선 터널을 추가하였을 경우에도 정확도 개선이 소폭 이루어지는 것을 확인하였다. 이를 통해 철도 터널 객체 분할 인식에서 학습 데이터의 수가 충분하다면 다양한 종류의 터널로 학습 데이터를 구성하여 효율성을 증대할 수 있음을 확인하였다.

Acknowledgements

본 연구는 한국철도기술연구원 주요사업 ‘기존 철도구조물의 BIM기반 유지관리를 위한 역설계 모델링 기술 개발(PK2103C2)’과 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(No. 2019R1C1C1008326)을 받아 수행되었으며, 이에 깊은 감사를 드립니다.

References

Hergunsel, M. F. (2011), "Benefits of Building Information Modeling for Construction Managers and BIM based Scheduling", Master's thesis, Worcester Polytechnic Institute.

Hong, S., Park, I.-S., Heo, J., and Choi, H. (2012), "Indoor 3D Modeling Approach based on Terrestrial LiDAR", KSCE Journal of Civil and Environmental Engineering Research, Vol.32, No.5D, pp.527-532 (in Korean). 10.12652/Ksce.2012.32.5D.527

Jaderberg, M., Simonyan, K., Zisserman, A., and Kavukcuoglu, K. (2015), "Spatial transformer networks", Advances in Neural Information Processing Systems.

Kim, H., Yoon, J., and Sim, S.-H. (2020), "Automated Bridge Component Recognition from Point Clouds Using Deep Learning", Structural Control Health Monitoring, Vol.27, No.9, e2591. 10.1002/stc.2591

Kreider, R., Messner, J., and Dubler, C. (2010), "Determining the Frequency and Impact of applying BIM for Different Purposes on Projects", Proceedings 6th International Conference on Innovation in Architecture, Engineering and Construction (AEC), pp.1-10.

Landrieu, L. and Simonovsky, M. (2018), "Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.4558-4567. 10.1109/CVPR.2018.00479

Lee, J.S., Park, J., and Ryu, Y.-M. (2021), "Semantic Segmentation of Bridge Components based on Hierarchical Point Cloud Model", Automation in Construction, Vol.130, 103847. 10.1016/j.autcon.2021.103847

Lee, O.-G. and Sim, J.-Y. (2021), "Point Cloud Acquisition and Preprocessing based on LiDAR", Broadcasting and Media Magazine, Vol.26, No.2, pp.9-17 (in Korean).

Meng, J. (2020), "Research on 3D spatial semantic segmentation based on PointNet", Master's thesis, Chonnam National University (in Korean).

Ministry of Economy and Finance (2020), "The Comprehensive Plan for the Korean New Deal", (in Korean).

Ministry of Land, Infrastructure and Transport (2018), "Smart Construction Technology Roadmap", (in Korean).

Park, J. (2021), "Method of Automating Scan-to-BIM Process based on Deep Learning", Master's thesis, Sejong University (in Korean).

Park, T.-S. and Lee, S.-H. (2015), "Analyses of Existing Tunnel Liner Behaviors Caused by Excavation of Upper Layer with Using Laser Scanning Technology", Journal of the Korean Geotechnical Society, Vol.31, No.10, pp.29-36 (in Korean). 10.7843/kgs.2015.31.10.29

Qi, C.R., Su, H., Mo, K., and Guibas, L.J. (2017), "PointNet, Deep Learning on Point Sets from 3D Classification and Segmentation", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.77-85.

Rao, Y., Zhang, M., Cheng, Z., Xue, J., Pu, J., and Wang, Z. (2021), "Semantic Point Cloud Segmentation Using Fast Deep Neural Network and DCRF", Sensors, Vol.21, 2731. 10.3390/s2108273133924465PMC8068939

Robert, L. (1986), "Stochastic Sampling in Computer Graphics", ACM Transaction on Graphics, Vol.5, No.1, pp.51-72. 10.1145/7529.8927

Soilán, M., Nóvoa, A., Sánchez-Rodríguez, A., Riveiro, B., and Arias, P. (2020), "Semantic Segmentation of Point Clouds with Pointnet and Kpconv Architectures Applied to Railway Tunnels", ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vol.V-2-2020. pp.281-288. 10.5194/isprs-annals-V-2-2020-281-2020

Wang, Y., Sun, Y., Liu, Z., Sarma, S.E., Bronstein, M.M., and Solomon, J.M. (2019), "Dynamic Graph CNN for Learning on Point Clouds", ACM Transaction on Graphics, Vol.38, No.5, 146. 10.1145/3326362

Journal of the Korean Geotechnical Society ISSN:1229-2427(Print) 2288-646X(Online) 한국지반공학회 논문집

Preview

Effect of Learning Data on the Semantic Segmentation of Railroad Tunnel Using Deep Learning

ABSTRACT

MAIN

Fig. 1

PointNet architecture (Qi et al., 2017)

Fig. 2

Tunnel cross-section modeled by 3D CAD

Table 1.

The cross-sectional dimensions of the tunnel

Fig. 3

Difference of PCD between the measured tunnel and 3D CAD model

Fig. 4

Categorize PCD through labeling

Table 2.

Learning and test data for each case

(1)

(2)

Fig. 5

Changes in results according to the number of learning data

Table 3.

Test results from Case 1 to Case 8 according to the ratio of approximate area (except for Case 2)

Fig. 6

Overall accuracy and MIoU when using different double-track tunnel data for learning and test

Fig. 7

Overall accuracy and MIoU when using different track type of tunnel for learning and test

Table 4.

Total number of point data on rail and sleeper for each tunnel normalized based on a single-track tunnel

Fig. 8

MIoU of rail and sleeper according to the ratio of approximate area

Fig. 9

Result of the semantic segmentation

Table 5.

Test results of the double-track tunnel by each learning data

Fig. 10

Overall accuracy and MIoU according to the number of tunnel types used for learning

Acknowledgements

References