1. 서 론
2. 배경이론
2.1 Independent Weighted(IW) 및 Annealing 기법
2.2 데이터 증폭
2.3 매끄러움(Smoothness) 및 공간상관(Spatial Correlation) 지표
3. 실험 위치 및 방법
4. 알고리즘
5. 결 과
5.1 IW 방법
5.2 어닐링 방법
6. 토 론
7. 결 론
1. 서 론
지반공학적 물성치는 지질 구조, 풍화 작용, 지하수위, 그리고 지층 구성물질의 불균질성 등 다양한 요인에 의해 공간적 이질성이 매우 높다(Ji et al., 2021; Christianson et al., 2023). 이러한 특성은 동일한 지역 내에서도 물리적 특성치가 급격히 변할 수 있음을 의미하며, 따라서 지반의 강도, 변형률, 또는 투수계수와 같은 지반공학적 물성치를 정확히 파악하기 위해서는 충분히 조밀한 측정망이 요구된다(Hong et al., 2024; Meng et al., 2024). 그러나 실제 현장에서는 조사비용, 장비 접근성, 지형 조건, 또는 환경 규제 등으로 인해 모든 위치에서 물성치를 직접 측정하는 것이 현실적으로 불가능하다. 그 결과, 대부분의 지반조사는 제한된 지점의 데이터에 의존하며, 미측정 지점의 물성은 공간적 추정에 의해 보완된다(Pang et al., 2023). 이러한 공간 추정의 정확도는 결국 측정 데이터의 개수와 분포, 그리고 적용된 통계·수학적 모델의 신뢰성에 의해 좌우된다.
기존의 대표적인 공간 보간 기법 중 하나인 크리깅(Kriging)은 지구통계학에 기반한 확률적 예측기법으로, 측정된 자료 간의 공간 상관관계를 정량화하여 미측정 지점의 값을 예측한다. 크리깅은 베리오그램(variogram)를 통해 거리에 따른 상관성 구조를 모델링하고, 이를 이용해 각 위치의 가중치를 산정한다(Yang et al., 2022). 이 방법은 이론적으로 매우 정교하며, 특히 자료가 충분히 확보되고 공간상관성이 일정하게 유지될 때는 높은 정확도를 보인다. 그러나 실무적 측면에서는 몇 가지 한계가 존재한다. 우선, 측정지점 간 거리가 멀어질수록 상관성이 급격히 감소하므로, 소규모 데이터 환경에서는 모델의 공분산 구조가 왜곡되어 예측 신뢰도가 크게 낮아진다. 또한 크리깅은 베리오그램을 가정해야 하고, 공분산 행렬의 역행렬 계산 과정이 필요하기 때문에, 데이터 개수가 적거나 이상치가 존재할 경우 수치적 불안정성이 발생할 수 있다. 더욱이 지반 물성치는 비선형적 패턴이나 국지적 불연속성이 자주 나타나는데, 이러한 특성은 크리깅의 선형 가정과 상충되어 예측의 한계를 초래한다.
이러한 한계로 인해, 최근에는 통계적·기계학습 기반의 대안적 예측기법들이 주목받고 있다. 특히 거리 가중에 기반한 Independent Weighted(IW) 기법은 비교적 단순한 구조를 가지면서도, 국지적 특성을 효과적으로 반영할 수 있는 장점이 있다. IW는 기존 IDW(Inverse Distance Weighting)의 확장된 개념으로, 측정 지점과 예측 지점 사이의 거리뿐만 아니라, 각 값의 상대적 영향도를 독립적으로 가중하여 공간적 평균값을 산정하는 통계적 예측 기법이다(Liu et al., 2021). 이 방법은 복잡한 공분산 계산이 필요 없으며, 입력 데이터의 크기가 작더라도 기본적인 거리 의존성을 보장한다. 그러나 IW는 근본적으로 통계적 평균화 기법이기 때문에, 예측값 간의 공간적 매끄러움(spatial smoothness)이 완전하게 확보되지 않으며, 일부 격자에서는 인접 셀 간 급격한 값의 차이가 발생할 수 있다. 이러한 한계를 보완하기 위한 접근법으로, 본 연구에서는 어닐링(Annealing)기법을 결합하였다. 어닐링은 물리학적 열역학 원리에 기반한 확률적 최적화기법으로, 에너지 최소화 개념을 통해 전역적 최적해를 탐색한다. 초기 상태에서 무작위로 배정된 데이터의 위치를 반복적으로 교환하거나 이동하면서, 전체 오차가 감소하도록 시스템을 냉각시키는 방식이다(Ghannadi et al., 2023). 초기에는 높은 온도로 인해 다소 비효율적인 해도 허용하면서 탐색 범위를 넓히고, 점차 온도를 낮추면서 오차가 가장 작은 상태로 수렴시킨다. 이러한 특성은 IW가 가지는 지역적 불연속성 문제를 완화하고, 전체 공간에서 값의 변동이 점진적이며 자연스럽게 변화하도록 만들어준다. 결과적으로 어닐링은 단순한 보간을 넘어, 국지적 이상치 제거 및 전역적 패턴의 부드러움 확보에 효과적이다.
본 연구에서는 IW와 어닐링 기법을 결합하여, 소규모 실측 데이터를 기반으로 증폭된 지반 물성 데이터의 좌표를 합리적으로 예측하고자 하였다. 이를 위해 원시 데이터는 SMOTE(Synthetic Minority Over-sampling Technique)와 ADASYN(Adaptive Synthetic Sampling) 알고리즘을 이용하여 데이터 수를 확장하였다. 두 증폭 알고리즘은 머신러닝 분야에서 소수 클래스 데이터의 불균형을 해소하기 위해 개발된 대표적 기법으로, 본 연구에서는 이를 공간적 데이터 보완에 적용하였다. SMOTE는 기존 데이터 간 선형 보간을 통해 새로운 샘플을 생성하고, ADASYN은 데이터 분포의 밀도 차이에 따라 가중치를 조정하여 희소 구간을 보완한다. 이렇게 생성된 증폭 데이터는 IW 및 어닐링 기법의 입력으로 사용되어, 기존 실측 데이터만으로는 재현하기 어려운 지반 물성치의 공간 분포를 보다 세밀하게 예측하도록 하였다. 또한, 본 연구에서는 예측된 좌표의 신뢰성을 정량적으로 평가하기 위해, Root Mean Square Error(RMSE) 및 Energy Function 값을 이용하여 IW와 어닐링의 성능을 비교하였다. 더불어, 어닐링 적용 후 결과의 공간적 연속성을 정량화하기 위해, Mean Absolute Neighbor Difference, Total Variation, Mean Gradient Magnitude, Semivariance at Lag 1, Moran’s I, Geary’s C 등 총 여섯 가지 공간 통계 및 부드러움(smoothness) 지표를 함께 도입하였다. 이를 통해 단순한 수치적 오차 비교를 넘어, 예측 결과의 공간적 일관성과 자연스러움을 함께 검증하였다.
2. 배경이론
2.1 Independent Weighted(IW) 및 Annealing 기법
지반공학 분야에서 공간적으로 불균질한 자료를 보정하기 위한 대표적인 통계적 접근법 중 하나는 거리 가중 평균법(Inverse Distance Weighting, IDW) 이다. IDW는 관측된 값들이 특정 지점에서 얼마나 가까운지를 고려하여 가중평균을 수행함으로써, 미측정 지점의 값을 예측한다. 본 연구에서 사용한 Independent Weighted(IW) 방법은 IDW의 확장된 형태로, 각 관측값이 주변 지점에 미치는 영향을 독립적으로 고려하여 통계적 공간 예측을 수행한다(Xiao et al., 2024). IW의 기본 원리는 거리의 역수(1/d) 또는 제곱 역수(1/d2)를 가중치로 설정하여, 인접한 측정값일수록 높은 영향력을 부여하고, 멀리 떨어진 값은 점진적으로 낮은 가중치를 갖도록 하는 것이다. 이를 수식으로 표현하면 다음과 같다.
여기서, zi는 측정된 물성값, di는 예측지점과 측정지점 간의 거리, p는 거리 지수(power parameter)이다. 본 연구에서는 p=2를 적용하여, 인접 지점의 영향을 상대적으로 강화하였다. IW는 비교적 계산이 단순하고 빠르며, 측정 데이터의 수가 적은 경우에도 기본적인 공간적 패턴을 재현할 수 있는 장점을 가진다. 그러나 각 격자의 예측이 독립적으로 수행되기 때문에, 인접 격자 간의 연속성이 완전히 보장되지 않으며, 결과적으로 일부 영역에서 급격한 값 변화가 발생할 수 있다.
이러한 문제를 보완하기 위해 본 연구에서는 어닐링(Annealing) 기법을 적용하였다. 어닐링은 물리학적 열처리 과정에서 유래한 확률적 최적화 알고리즘으로, 초기 상태에서 높은 온도를 설정하여 다양한 해를 탐색하고, 온도를 점차 낮추어가면서 전체 시스템의 에너지 함수를 최소화하는 방식이다(Venkateswaran et al., 2022). 본 연구에서 어닐링은 IW로 배정된 초기 좌표를 입력으로 사용하여, 각 증폭 데이터가 배정된 격자 간의 스왑 연산을 반복 수행하면서 전체 에너지(예측값과 평균값의 차이 제곱합)가 최소가 되도록 최적화하였다. 온도는 반복에 따라 점진적으로 감소시키며, 일정 확률로 비효율적인 해도 수락하여 지역 최소에 빠지는 것을 방지하였다. 결과적으로 어닐링은 국소적 패턴의 부드러움을 유지하면서도 전역적 안정성을 향상시키는 역할을 수행한다. 따라서 IW와 어닐링의 결합은 통계적 예측과 확률적 최적화의 장점을 함께 활용하는 접근법으로, 소규모 데이터 환경에서도 국지적 불연속성을 완화하고 공간적으로 일관된 분포를 얻을 수 있을 것으로 기대된다.
2.2 데이터 증폭
데이터 기반 예측 모델의 성능은 입력 데이터의 수와 다양성에 크게 의존한다. 그러나 지반조사 자료의 경우, 실험·측정에 소요되는 시간과 비용, 현장 접근성 등의 제약으로 인해 측정점 수가 매우 제한적이다(Yoon, 2023). 본 연구에서는 이러한 문제를 해결하기 위해 데이터 증폭개념을 도입하였다. 특히, Synthetic Minority Over-sampling Technique(SMOTE)와 Adaptive Synthetic Sampling (ADASYN) 알고리즘을 적용하여 실측 데이터를 확장하였다. SMOTE는 원래 분류 문제에서 소수 클래스의 학습 불균형을 해소하기 위해 제안된 방법으로, 기존 데이터 간의 선형 보간을 통해 새로운 합성 데이터를 생성한다. 예를 들어, 두 데이터 xi, xj 사이에서 다음과 같이 새로운 데이터 xnew를 만든다.
이때 λ는 0과 1 사이의 난수로, 두 데이터 사이를 선형적으로 보간한 위치에 새로운 데이터를 생성한다. 반면, ADASYN은 SMOTE의 한계를 보완한 방식으로, 데이터의 분포 밀도에 따라 가중치를 부여하여 데이터가 부족한 구간에서 더 많은 합성 데이터를 생성하도록 설계되어 있다. 즉, 국소적으로 희소한 지역에서는 증폭 비율을 높여 균형 잡힌 데이터 분포를 구축한다.
본 연구에서는 총 23개 실측 데이터를 대상으로 두 증폭 알고리즘을 병행 적용하여, 총 1,777개의 증폭 데이터를 생성하였으며, 이를 IW 및 어닐링 기법의 입력 데이터로 활용하였다. 이렇게 생성된 데이터는 실측값의 통계적 특성과 분포 형태를 유지하면서도, 예측 모델이 학습할 수 있는 데이터 밀도를 높여, 제한된 입력에서도 공간적 패턴을 안정적으로 재현할 수 있게 한다.
2.3 매끄러움(Smoothness) 및 공간상관(Spatial Correlation) 지표
예측된 좌표 결과의 신뢰도를 단순한 수치 오차(RMSE, Energy)로만 평가하는 것은 한계가 있다. 실제 공간 데이터의 품질은 인접 셀 간의 연속성, 값의 급격한 변화 여부, 그리고 공간적 자기상관 정도에 의해 결정되기 때문이다. 이에 본 연구에서는 IW 및 어닐링 결과의 공간적 부드러움(spatial smoothness)과 공간상관성(spatial correlation)을 정량화하기 위해 총 여섯 가지 대표 지표를 활용하였으며, 각각이 의미하는 내용은 다음과 같이 간략하게 소개하였다.
• Mean Absolute Neighbor Difference: 인접 격자 간 값의 절대 차이 평균으로, 전체적인 국소 거칠기(local roughness)를 표현한다.
• Total Variation: 값의 절대 미분합(∑|∂Z/∂x| + |∂Z/∂y|)으로 정의되며, 공간적 변화량의 총합을 나타내는 영상처리 기반 지표이다.
• Mean Gradient Magnitude: 각 격자의 기울기크기의 평균값으로, 전반적인 경사도의 강도를 정량화 한다.
• Semivariance at Lag 1: 인접 격자 간 값의 제곱 차이를 기반으로 한 semivariogram의 h=1 시점 값으로, 미시적 변동성을 평가한다.
• Moran’s I: 전역 공간 자기상관을 나타내는 통계량으로, 1에 가까울수록 공간 패턴이 유사함을 의미한다.
• Geary’s C: Moran’s I와 상보적인 지표로, 0에 가까울수록 높은 상관성을, 1보다 클수록 음의 상관을 나타낸다.
이들 지표는 서로 다른 관점에서 공간적 특성을 측정하지만, 공통적으로 값이 부드럽고 연속적인 분포를 가질수록 (a)~(d)는 감소하고, (e)는 증가, (f)는 감소하는 경향을 보인다. 따라서 본 연구에서는 이 여섯 가지 지표를 종합적으로 활용하여, 어닐링 기법이 IW에 비해 결과적으로 더 매끄럽고 일관된 공간 분포를 형성하는지 여부를 정량적으로 검토하였다.
3. 실험 위치 및 방법
본 연구의 대상지는 대한민국 세종특별자치시에 위치한 괴화산(Goihwa-san) 일원으로, 해발 약 200~250 m의 완만한 구릉성 지형을 형성하고 있다. 연구 지역은 기반암이 표층 근처까지 노출되어 있는 곳과 풍화토가 두껍게 분포한 지역이 공존하는 복합 지질대를 이루고 있으며, 토층의 불균질성과 변동성이 뚜렷한 특징을 보인다. 특히 이 지역은 선형 경사면이 많고, 사면 하부로 갈수록 미세입자 퇴적층이 발달하여 지반 물성의 공간적 변동이 큰 지역으로 알려져 있다. 이러한 지형적·지질학적 특성은 동일한 측점 간에도 토심(soil depth)과 강도 특성이 상당히 달라지는 결과를 초래한다. 현장 조사는 이러한 공간적 변동 특성을 반영하기 위해 동적 콘 관입시험(Dynamic Cone Penetration Test, DCPT 을 활용하여 수행하였다. DCPT는 표준 관입시험(SPT)보다 간편한 장비로 현장에서 빠르게 수행할 수 있는 침투 저항 시험으로, 타격 횟수와 관입 깊이 간의 관계를 통해 지반의 상대밀도 및 강도를 추정할 수 있다(Kim et al., 2021; Kim et al., 2022). 본 연구에서는 이 시험 결과를 토대로 각 측점의 토심을 추정하였다. 여기서 토심은 지표면으로부터 풍화대 상부까지의 깊이로 지반 구조와 침투저항 분포를 종합적으로 반영하는 물리적 지표이다. 측정된 토심은 단위 mm 로 환산되어 분석에 활용되었다.
총 23개 측정 지점이 지형의 중심선과 양측 사면을 따라 배치되었으며, 각 지점의 좌표(X, Y)에 따른 토심 값을 추정하였다. 예를 들어, (X = 0 m, Y = 0 m) 지점에서의 토심은 1,900 mm, (X = 14 m, Y = 67 m) 지점에서는 1,700 mm 로 측정되었다. 전체 측정값은 약 1,700 ~ 1,950 mm의 범위를 가지며, 평균값은 약 1,850 mm 수준으로 나타났다. 이러한 값의 편차는 지형적 고저차와 풍화 정도의 차이에 기인하며, 괴화산 일대의 지반이 상대적으로 얕은 기반암과 불균질한 풍화토층이 공존하는 복합 지반임을 시사한다. 측정된 데이터는 총 23개 좌표의 (X, Y, Soil depth) 형태로 정리되어 본 연구의 기본 입력자료로 사용되었다. 그러나 측점 수가 공간적으로 매우 제한적이기 때문에, 미측정 구간에서의 공간 예측을 수행하기 위해 데이터 증폭 과정이 필요했다. 이를 위해 본 연구에서는 머신러닝 기반의 오버샘플링 기법인 SMOTE와 ADASYN 알고리즘을 병행하여 데이터를 확장하였다. SMOTE는 기존 측정값 간의 선형 보간을 통해 새로운 데이터를 생성하는 방식으로, 국소적으로 균질한 분포를 형성한다. 반면 ADASYN은 데이터 밀도가 낮은 구간에 가중치를 부여하여, 공간적으로 불균질한 영역에서 추가 데이터를 집중적으로 생성한다. 두 방법을 병합함으로써, 실측 데이터의 통계적 특성과 분포 경향을 유지하면서도, 희소 지역에서의 데이터 밀도를 강화할 수 있었다. 이 과정을 통해 총 1,777개의 증폭 데이터가 생성되었으며, 원래의 실측 데이터(23개)와 합쳐 총 1,800개의 데이터 세트가 구축되었다. 이후, 이 데이터는 두 가지 좌표 예측 알고리즘인 IW 및 어닐링에 각각 적용되었다. IW는 거리 기반의 통계적 가중 평균 모델로, 측정값 간 거리의 역수를 가중치로 사용하여 각 격자의 예측값을 산정하였다. 본 연구에서는 거리 가중 지수 p=2 를 적용하여, 인접 지점의 영향을 상대적으로 강화하였다. 반면, 어닐링은 IW 결과를 초기 상태로 설정한 후, 확률적 교환연산을 반복 수행하면서 전체 에너지 함수를 최소화하도록 개선하였다. 초기 단계에서는 높은 온도에서 다양한 좌표 조합을 탐색하고, 점진적으로 온도를 낮추며 국소 최소를 회피하여 전역 최적해에 수렴하도록 하였다. 모든 예측은 1 m × 1 m 간격으로 설정된 총 1,800개 격자에 대해 수행되었다. 결과적으로, IW는 각 격자에 독립적으로 값을 배정하는 통계적 공간 보간 역할을 수행하였으며, 어닐링은 이를 기반으로 전체 공간에서의 매끄러움(smoothness)과 연속성(continuity)을 향상시키는 확률적 최적화 역할을 수행하였다.
이와 같은 연구 설계는 소규모 데이터 환경에서의 좌표 예측 가능성을 검증하고, IW 및 어닐링 기법의 상대적 성능을 실험적으로 평가하기 위한 것이다. 특히 본 연구는 실제 현장에서 확보된 토심 데이터를 기반으로 하여, 기존의 순수한 통계 보간 기법과 확률적 최적화 기법 간의 차이를 정량화함으로써, 향후 지반 물성 예측 및 공간 모델링 연구에 적용 가능한 실질적 기준을 제시한다.
4. 알고리즘
본 연구의 좌표 예측 절차는 Fig. 2와 같이 크게 다섯 단계로 구성된다. (1) 데이터 로드, (2) IW 기반의 초기 배정, (3) 어닐링을 통한 정제, (4) 결과 저장 및 시각화, (5) 성능 평가의 순서로 진행되었다. 우선, 데이터 로드 단계에서는 현장에서 획득한 실측 자료와 SMOTE 및 ADASYN 알고리즘을 통해 증폭된 데이터를 불러와 분석 기반을 마련하였다. 실측 좌표(X, Y)와 대응되는 토심 데이터를 기준으로, 동일한 공간 해상도(1 m × 1 m)를 갖는 격자망을 구축하였다. 이때, 총 1,800개의 격자 중 실측값이 존재하는 23개 지점은 초기 점유 셀로 고정하여 이후 예측 과정에서 중복 배정이 발생하지 않도록 하였다. 그 다음으로 IW 기법을 적용하여 초기 좌표 배정을 수행하였다. IW는 거리 가중 평균 원리를 이용해 각 격자점의 예상 토심값(μ)을 계산한 뒤, 증폭된 데이터 각각을 μ 값에 가장 부합하는 위치에 확률적으로 배정한다. 이 과정에서 인접 셀일수록 높은 가중치를, 먼 셀일수록 낮은 가중치를 부여하며, 모든 증폭값이 격자 내에서 중복 없이 배정되도록 제약 조건을 설정하였다. 이렇게 생성된 IW 결과는 이후 어닐링의 초기 입력으로 활용되며, 전체 예측의 기본 형태를 결정한다.
어닐링 정제 단계에서는 IW 결과를 기반으로 전체 시스템의 에너지를 최소화하도록 데이터를 재배치하였다. 알고리즘은 임의의 두 격자에 배정된 값을 교환하면서 오차 변화를 계산하고, 오차가 줄어드는 경우에는 새로운 상태를 유지한다. 반대로 오차가 다소 증가하더라도 일정 확률로 수용하여 지역 최적해에 빠지는 것을 방지하였다. 온도는 반복이 진행될수록 점진적으로 낮아지며, 초기에 전역 탐색을 수행한 후 점차 세밀한 국소 탐색으로 전환된다. 이 과정을 거치면 인접 격자 간 토심 변화가 완화되고, 전체 분포가 한층 매끄럽고 일관된 형태로 수렴한다. 이후 결과 저장 및 시각화 단계에서는 IW와 어닐링 결과를 각각 실측값과 병합하여 (X, Y, Value) 형식의 테이블로 정리하고, 동일한 컬러 범위를 적용하여 2차원 공간 분포로 시각화하였다. 이를 통해 두 기법 간 토심 분포의 패턴, 지역적 변동성, 그리고 전반적인 매끄러움의 차이를 직관적으로 비교할 수 있었다.
마지막으로, 성능 평가 단계에서는 두 기법의 정량적 차이를 검토하였다. 각 결과의 오차 수준은 RMSE와 Energy를 이용해 평가하였으며, 계산 효율성은 실행 시간(runtime)으로 비교하였다. 또한 공간적 특성을 함께 파악하기 위해 여섯 가지 매끄러움 및 공간상관 지표—Mean Absolute Neighbor Difference, Total Variation, Mean Gradient Magnitude, Semivariance at Lag 1, Moran’s I, Geary’s C—를 추가 분석하였다. 이러한 지표들은 예측 결과의 부드러움과 공간적 일관성을 나타내며, 어닐링 적용 후 얼마나 자연스럽고 연속적인 지반 분포가 형성되었는지를 판단하는 근거로 활용되었다.
5. 결 과
5.1 IW 방법
Fig. 3은 SMOTE와 ADASYN 알고리즘으로 증폭된 토심 데이터를 각각 IW(Independent Weighted) 기법을 적용하여 예측한 결과를 보여준다. (a)는 SMOTE 기반으로 증폭된 데이터를 활용한 결과이며, (b)는 ADASYN 기반으로 증폭된 데이터를 적용한 결과이다. 두 결과 모두 동일한 격자 해상도(1 m × 1 m)로 구성된 20 m × 90 m 영역을 대상으로 수행되었으며, 각 격자에는 IW 가중 평균을 통해 예측된 토심 값이 할당되었다. 전반적으로, IW 기법을 통해 예측된 두 결과는 공간 분포 패턴과 값의 범위 모두에서 매우 유사한 형태를 보였다. 이는 SMOTE와 ADASYN으로 생성된 증폭 데이터의 통계적 분포가 원본 실측값의 특성을 잘 보존하고 있으며, 두 알고리즘 모두 기존 데이터 간의 선형 관계 또는 지역적 분포 특성을 기반으로 합성 데이터를 생성하기 때문이다. SMOTE 기반 결과의 경우, 격자 전체에서 토심 값이 1,700~1,950 mm의 범위를 나타냈으며, 지역적으로는 X축 10~20 m, Y축 70~90 m 부근, 즉 그림의 오른쪽 상단 영역에서 토심이 1,700~1,750 mm 수준으로 낮게 형성된 구간이 확인되었다. 이는 해당 구간의 지반이 상대적으로 얕은 풍화층을 가지거나, 기반암이 표층 가까이에 존재함을 시사한다. 이외의 구간에서는 1,750~1,950 mm 범위의 값이 불규칙하게 분포하였으며, 명확한 방향성이나 대규모 경사는 관찰되지 않았다. 이러한 결과는 IW 기법의 계산 특성상 각 격자점이 독립적으로 주변 측정값과의 거리 가중 평균으로 계산되기 때문에, 격자 간 상호 영향을 직접적으로 반영하지 않아 전체적으로는 랜덤한 패턴이 형성된 것으로 해석된다. ADASYN 기반 결과 역시 전반적인 공간 분포 경향은 SMOTE 결과와 거의 일치하였다. 오른쪽 상부 영역에서 토심이 낮게 분포하는 경향이 동일하게 나타났으며, 다른 구간에서도 1,700~1,950 mm 사이의 값이 불규칙하게 분포하였다. 다만, ADASYN의 특성상 데이터 밀도가 낮은 구간에서 합성 데이터가 상대적으로 더 많이 생성되기 때문에, 일부 지역에서는 SMOTE 결과보다 다소 세밀한 값의 변동의 미세한 점상 패턴이 관찰된다. 이는 ADASYN이 희소 영역에 가중치를 더 부여함으로써, 데이터의 지역적 불균질성을 반영하려는 특성에서 기인한 것이다. 그럼에도 불구하고, 두 방법 모두 실측값의 범위 내에서 일관된 예측 결과를 보였으며, 전체적인 평균 토심 분포는 약 1,850 mm로 유지되어, 데이터 증폭 과정에서 통계적 왜곡이 발생하지 않았음을 확인할 수 있다.
하지만, 두 결과 모두에서 인접 격자 간의 값 변화가 불규칙하고, 국소적으로 토심이 급격히 변하는 구간이 다수 존재하였다. 이는 IW의 근본적인 한계로, 각 격자점의 예측이 독립적으로 수행되어 인접 셀 간의 연속성이 확보되지 않기 때문이다. 즉, IW는 지역적 변동을 반영하되, 전체 분포를 부드럽게 연결하지 못하는 단점이 있다. 이로 인해 결과에서는 국소적으로 값이 들쭉날쭉한 불균질 패턴이 나타나며, 일부 지역에서는 급격한 값의 변화로 인해 공간적으로 비자연스러운 경계가 형성되었다. 이러한 단점을 보완하기 위해, 본 연구에서는 후속 단계에서 어닐링 기법을 도입하여 전체 공간에서의 에너지를 최소화함으로써 분포의 매끄러움을 확보하고자 하였다.
5.2 어닐링 방법
어닐링(Annealing) 기법이 적용된 결과는 Fig. 4에 도시하였으며, Fig. 3과 동일하게 (a)는 SMOTE 기반 증폭 데이터를 입력으로 한 결과이며, (b)는 ADASYN 기반 데이터를 활용한 결과이다. 두 경우 모두 동일한 격자(20 m × 90 m, 간격 1 m)를 대상으로 수행되었으며, 초기 IW 결과를 어닐링을 통해 반복적으로 최적화하여 전체 오차(에너지 함수)가 최소가 되도록 수렴시켰다. 우선, 두 결과 모두 전반적인 토심의 공간 분포 범위는 IW 결과와 동일하게 1,700~1,950 mm 구간에 위치하였으나, 공간적 패턴은 한층 부드럽고 일관된 형태로 변하였다. IW 결과에서 관찰되었던 국소적인 불연속성과 점상 잡음은 어닐링 과정에서 대부분 제거되었으며, 인접 격자 간 값의 변화가 점진적이고 자연스럽게 이어지는 양상을 보인다. 특히 SMOTE 기반 결과의 경우, 이전 IW 결과에서 불규칙하게 흩어져 있던 고토심(1,900 mm 이상) 구간이 Y = 60~80 m, X = 5~10 m 부근으로 응집되어 명확한 공간적 군집을 형성하였다. 이는 어닐링의 확률적 스왑 과정이 전체 에너지 감소 방향으로 수렴하면서, 값이 유사한 셀들이 공간적으로 가까운 위치로 재배정된 결과로 해석된다. ADASYN 기반 결과 또한 유사한 경향을 보였지만, SMOTE 결과에 비해 미세한 변화폭이 더 완만하며 지역적 경계가 더욱 부드럽게 연결되었다. 이는 ADASYN이 희소 구간에 더 많은 합성 데이터를 생성하는 특성으로 인해 초기 데이터 분포가 다소 균질화되었고, 이에 따라 어닐링 과정에서도 급격한 값의 재배치보다는 완만한 조정이 이루어진 것으로 판단된다. 두 결과 모두 어닐링 적용 이후 국소적 이상점이 사라지고, 격자 전반에서 연속적인 토심 변화 패턴이 뚜렷하게 나타나며, 전체적으로 섬(isolated patch) 형태의 불규칙한 분포가 크게 감소하였다. 주목할 점은, 어닐링 결과에서 토심이 낮은 영역(1,700~1,750 mm)이 IW 결과에 비해 다소 압축되어 나타났다는 것이다. 특히 오른쪽 상부(Y = 70~90 m) 구간에서는 IW에서 보였던 저토심 점들이 연속적인 띠 형태로 정렬되며, 실제 지형적 변화에 따른 토심 경계와 유사한 형태를 보였다. 이는 어닐링이 인접한 격자 간의 상호 연관성을 고려하여 국소 패턴을 조정했기 때문이며, 결과적으로 공간적 경향성이 보다 명확하게 드러났다. 반면, 고토심(1,900 mm 이상) 영역은 사면의 중심부(Y = 40~70 m, X = 5~10 m) 부근에서 상대적으로 넓게 확장되어, 지역 내 토심의 중심 경향을 잘 재현하였다.
이와 같은 변화는 통계적 가중 평균에 기반한 IW의 결과에 비해, 어닐링이 공간적 상호작용을 추가적으로 반영한 결과라고 할 수 있다. IW는 각 셀의 값을 독립적으로 계산하므로 인접 셀 간 관계가 고려되지 않지만, 어닐링은 전체 격자에서의 에너지 최소화를 목표로 하여 전역적인 최적화를 수행한다. 이 과정에서 인접 셀 간 값의 차이가 줄어들고, 결과적으로 공간적 매끄러움이 향상된다. 또한, 어닐링은 탐색 과정에서 일정 확률로 비효율적인 교환도 허용하기 때문에, 지역 최소에 갇히지 않고 전체 분포의 균형을 조정할 수 있다. 이로 인해 SMOTE와 ADASYN 모두 초기 IW 결과보다 공간적 분산이 줄어들고, 국소적으로 불연속적이던 값이 점차 주변 셀과의 관계 속에서 재배치되었다. 이러한 특성은 특히 ADASYN 기반 결과에서 더 뚜렷하게 나타나며, 시각적으로는 색상 변화가 완만해지고 값의 등고선이 자연스럽게 이어지는 양상을 보인다.
6. 토 론
Fig. 5는 SMOTE 및 ADASYN 알고리즘으로 증폭된 데이터를 입력으로 하여, IW와 어닐링 기법을 적용했을 때의 정량적 성능 비교 결과를 나타낸 것으로, RMSE, Energy 그리고 Runtime을 각각 보여준다. 이 세 가지 지표는 각각 예측 정확도, 상대적 오차 안정성, 계산 효율성을 나타내며, IW와 어닐링의 성능 차이를 수치적으로 평가하는 기준으로 사용되었다. RMSE 결과는 IW 대비 어닐링을 적용했을 때 오차가 명확히 감소하는 경향을 보인다. SMOTE 기반의 경우 IW의 RMSE는 약 55 mm 수준으로 나타난 반면, 어닐링 적용 후에는 약 40 mm로 약 27% 감소하였다.
ADASYN 기반 데이터에서도 유사한 경향이 확인되었으며, IW에서 약 53 mm이던 RMSE가 어닐링에서는 약 38 mm 수준으로 낮아졌다. 이 결과는 어닐링의 확률적 탐색과 반복적인 스왑연산이 전체 오차를 최소화하는 방향으로 작용했음을 의미한다. 즉, IW가 각 격자점을 독립적으로 예측하여 지역적 불연속성이 발생했던 것과 달리 어닐링은 격자 간 상호 연관성을 반영하여 데이터의 공간적 일관성을 강화함으로써, 전반적인 예측 안정성과 정밀도가 향상된 것으로 해석된다. 에너지 에서도 동일한 경향이 뚜렷하게 나타난다. IW의 에너지 값은 SMOTE와 ADASYN에서 각각 약 1,200과 1,250 수준이었으나, 어닐링 적용 이후에는 약 700~800 수준으로 약 40% 이상 감소하였다. 에너지 값이 낮아진다는 것은 각 증폭값과 예측간의 정규화된 오차가 줄어들었음을 의미하며, 이는 단순히 RMSE가 낮아졌다는 수치적 개선뿐 아니라, 공간적으로 분포된 예측값들이 μ 값 주변으로 더 균일하게 재배치되었음을 의미한다. 즉, 어닐링은 국소적 이상치를 완화시키고, 공간 전역적으로 에너지 균형이 유지되는 안정화된 예측 구조를 형성한다. 이러한 경향은 SMOTE와 ADASYN 모두에서 동일하게 나타나, 증폭 알고리즘의 종류와 관계없이 어닐링이 IW보다 항상 낮은 에너지 상태로 수렴함을 보여준다. 한편, Fig. 5의 (c)인 Runtime 결과에서는 IW가 어닐링보다 빠른 계산 속도를 보였다. IW는 각 격자에 대해 거리 기반의 가중 평균만 계산하기 때문에 연산이 단순하며, 평균 실행 시간이 약 0.3~0.4초 수준으로 나타났다. 반면, 어닐링은 반복과정에서 스왑 연산을 수천~수만 회 수행하기 때문에 전체 수행 시간이 약 1.2~1.4초 수준으로 증가하였다. 즉, 어닐링은 IW 대비 약 3~4배 정도의 계산 시간이 소요되지만, 그에 비례하여 RMSE와 Energy가 크게 감소하였다는 점에서 정확도 향상 대비 연산 효율이 합리적인 수준으로 평가된다. 특히 어닐링의 계산 부하는 반복 횟수와 온도 감쇠율에 따라 조정이 가능하므로, 적절한 파라미터 튜닝을 통해 정확도와 효율성 간 균형을 맞춘다면 더욱 효율적인 구동이 가능할 것으로 판단된다.
Fig. 6은 IW와 어닐링 기법의 결과를 6개의 공간적 지표를 통해 정량적으로 비교한 결과를 보여준다. 이들 지표는 공간적으로 예측된 토심 분포의 부드러움과 공간 자기상관을 나타내며, 값의 변화가 완만하고 패턴이 연속적일수록 부드러움이 높고, Moran’s I가 증가하며 Geary’s C가 감소하는 방향으로 결과가 개선된다. Fig. 6의 (a)와 (b)를 살펴보면, 어닐링을 적용한 경우 두 지표 모두 IW보다 낮은 값을 나타냈다. 이는 인접한 격자 간 토심 차이가 줄어들고, 공간적으로 급격한 값 변화가 완화되었음을 의미한다. 즉, 어닐링이 IW 결과에서 존재하던 국소적 불연속성을 제거하고, 전체적으로 매끄럽고 일관된 분포를 형성했음을 보여준다. 특히 SMOTE와 ADASYN 기반 데이터 모두에서 동일한 감소 경향을 보였으며, 이는 어닐링이 데이터 증폭 방법에 관계없이 효과적으로 국소적 진동을 억제함을 시사한다. Fig. 6 (c)의 Mean Gradient Magnitude 역시 어닐링 후 감소하였다. 이 지표는 토심 값의 공간적 기울기 평균을 나타내며, 값이 낮을수록 인접 격자 간 변화율이 완만하다는 것을 의미한다. IW 결과에서는 지역적으로 급격한 값의 상승·하강이 발생하여 상대적으로 높은 기울기 값을 보였지만, 어닐링은 반복적인 스왑 과정을 통해 격자 간의 연속성을 높여 전반적인 경사 크기를 줄였다. 이는 어닐링의 확률적 탐색이 국소적인 급변 구간을 평탄화하는 방향으로 작동했음을 보여주는 결과다. Fig. 6의 (d) 결과에서도 어닐링이 IW보다 낮은 값을 나타냈다. 이 지표는 인접 격자 간 토심의 제곱 차이의 평균을 나타내며, 작을수록 미시적 변동성이 적고 데이터가 공간적으로 균질함을 의미한다. 즉, IW에서 나타났던 세밀한 수준의 잡음과 불규칙한 패턴이 어닐링 과정에서 정제되어, 인접 격자 간 값의 분산이 현저히 줄어든 것이다. 이는 앞선 RMSE 및 Energy 분석 결과와 일관되며, 어닐링이 국소 단위에서의 오차 분포까지 효과적으로 조정했음을 입증한다. 반면, Fig. 6의 (e)인 Moran’s I 값은 IW보다 어닐링에서 뚜렷하게 증가하였다. Moran’s I는 공간적 자기상관의 정도를 나타내는 대표 지표로, 1에 가까울수록 주변 셀 간 값의 유사성이 높음을 의미한다. 어닐링은 인접한 격자 간의 유사성을 강화하기 때문에 공간 패턴이 더욱 명확하게 연결되어 Moran’s I가 향상되었다. 이는 어닐링이 국지적 값의 조정을 통해 토심의 연속적 분포를 형성하며, 공간적으로 상관된 구조를 강화한 결과로 볼 수 있다. 마지막으로 Fig. 6의 (f)인 Geary’s C 는 Moran’s I와 상보적인 지표로, 값이 1보다 작을수록 양의 상관이 강하고, 1보다 크면 음의 상관이 강하다는 것을 의미한다. 그림에서 확인할 수 있듯이, 어닐링의 Geary’s C 값은 IW보다 낮게 나타났다. 이는 인접 셀 간 차이가 줄어들고, 토심이 비슷한 값으로 군집화되었음을 보여준다. 다시 말해, 어닐링 결과는 공간적으로 더욱 자연스럽고 일관된 토심 패턴을 갖추고 있으며,국소 영역에서의 불균질성이 현저히 감소한 것이다. 결과적으로 어닐링은 공간적 연속성과 부드러움을 동시에 확보하면서, 데이터의 통계적 특성과 실제 지형의 경향을 더 잘 반영하는 결과를 도출하였다. 또한 SMOTE와 ADASYN 간의 차이는 매우 미미하여, 데이터 증폭 기법 자체가 공간적 매끄러움에 미치는 영향은 제한적인 것으로 나타났다.
7. 결 론
본 연구에서는 소규모 실측 자료 기반의 지반 물성을 효율적으로 예측하기 위한 방법론을 제안하였으며, 통계적 예측 기법인 IW와 확률적 최적화 기법인 어닐링을 결합하여 데이터의 공간적 연속성과 예측 안정성을 향상시키는 새로운 접근법을 제시하였다. 각 연구 결과의 주요한 결론은 다음과 같이 요약된다.
(1) SMOTE 및 ADASYN 알고리즘을 이용하여 1,777개의 합성 데이터를 생성한 후 IW 기법으로 초기 좌표 배정하였으며 어닐링 기법을 적용하여 전체 에너지 함수를 최소화함으로써 공간적으로 매끄럽고 안정된 예측 결과를 도출하였다. IW는 전체적인 토심 분포의 경향을 재현하는 데 효과적이었으나 인접 격자 간의 불연속성과 국소적인 잡음이 다수 관찰되었다. 반면, 어닐링을 적용한 결과에서는 국소적 진동이 완화되고 인접 격자 간의 값이 점진적으로 연결되어 전체적으로 부드럽고 일관된 공간 분포가 형성되었다.
(2) 이와 같은 결과는 정량적 비교에서도 명확히 확인되었으며, IW 대비 어닐링의 RMSE는 약 25~30% 감소하였고, Energy는 약 40% 이상 줄어들어 예측 안정성이 크게 향상되었다. 또한, 공간 구조 지표 분석 결과, 어닐링은 Mean Absolute Neighbor Difference, Total Variation, Mean Gradient Magnitude, Semivariance at Lag 1 값이 모두 감소하였으며, Moran’s I는 증가하고 Geary’s C는 감소하여 공간적 자기상관이 강화되었다. 이는 어닐링이 단순한 통계적 보간을 넘어, 공간적으로 연속적이고 지형 변화에 부합하는 분포를 형성했음을 의미한다.
(3) IW가 전역적인 분포 형태를 결정하고, 어닐링이 이를 국소적으로 보정하여 공간적 매끄러움을 확보하는 구조는 지반공학 데이터뿐 아니라 다양한 공간 데이터 예측 문제에도 적용 가능하다. 향후 연구에서는 본 기법을 다른 지반 물성에 확대 적용하고, 보다 정교한 불확실성 기반 예측모델로 확장할 계획이다.








