서 론
연구방법
연구대상지 선정
수질분석 및 지수평가
연구결과
수질분석 결과
수화학유형 평가
DRASTIC 지수 평가결과
WELCUP 지수 평가결과
오염평가 지수 간 상관관계 분석
오염원 분포에 따른 상관관계
결 론
서 론
제주도는 투수성이 양호한 현무암질 화산암으로 구성되어 있으며 강우가 지하로 함양되기 쉬운 지질로 이루어져 있어 지하수 오염에 취약한 특성을 가진다. 이와 더불어 제주도는 생활용수는 물론 농업용수와 공업용수의 대부분을 지하수에 의존하고 있어 지하수의 보전관리가 매우 중요하다. 특히, 2012년 이후 제주 지역의 연평균 인구증가율이 2~3%가 될 정도로 인구가 가파르게 증가하여 이에 따른 생활하수 배출량도 급속하게 증가하고 있으나, 공공 하수처리 시설용량 부족으로 인해 공공 처리장에서 배출량을 전부 처리하지 못하고 있는 실정이다. 또한, 하수관로망이 설치되어 있지 않은 해발고도 200 m 이상의 중산간 지역에 주택 등이 집중적으로 신축되어 있고, 이에 따른 지하 침투식 개인하수처리 시설 설치가 증가하는 추세여서 지하수의 수질 악화가 예상된다.
이에 따라 제주도 지하수를 지속 이용 가능한 자원으로 보전 ‧ 관리하기 위한 체계적이고 과학적인 지하수 수질관리 방안의 필요성이 대두되고 있으며, 지하수 수질의 장기적인 수질변화 추세를 모니터링하기 위한 지하수 수질측정망 구축이 필수적으로 요구되고 있다.
본 연구에서는 경작지 비료살포, 가축분뇨 배출, 개인하수처리 시설 등 다양한 오염원에 따른 오염도가 증가하고 있는 대정읍, 한림읍 등 제주 서부지역에 지하수 수질관측망을 설치하여 지하수 오염취약성 평가지수를 산출하고, 수질분석 결과와 비교하여 지하수 오염과의 상관관계를 분석하고자 한다. 또한, 기존 지하수 오염취약성 평가의 한계를 보완하고 실질적 예측력을 갖춘 모델을 개발하고자, 기존의 오염취약성 평가지수에 더하여 지표 오염원과의 거리 기반 공간 변수를 통합한 새로운 회귀모델을 제안한다. 이를 통하여 제주도 서부지역의 지하수 관정을 대상으로 질산성질소(NO3-N) 농도를 보다 효과적으로 예측하고 오염원 특성과의 관계를 정량적으로 분석함으로써, 제주 지역의 지하수 평가 ‧ 관리 및 정책 수립에 기여할 수 있는 실질적이고 적용 가능한 분석기반을 구축하여 제공하고자 한다.
연구방법
연구대상지 선정
연구대상지는 지하수 수질전용측정망 구축 ‧ 운영계획(JSSGP and KRC-J, 2020)을 참고로 하여 오염 확산 면적이 넓은 대정 ‧ 한림유역과 조천유역을 중심으로 선정하였고, 오염지시자인 질산성질소 분석 결과에 따라 먹는물 수질기준인 10 mg/L 이상인 지역의 면적을 합산하여 면적대비 우선순위를 결정하였다.
선정된 연구대상 지역은 전체 43지점(대정 23지점, 조천 12지점, 한림 8지점)으로, 오염원 분포현황과 관측정 설치를 위한 충분한 부지, 그리고 활용 가능지역 등 복합적인 요인을 종합 분석하여 유역별 신규 오염감시측정망 6개소와 기존 시설 1개소를 배경수질 측정망으로 선정하였다(KRC-J, 2021).
유역별 시추조사 대상지는 대정유역 3개소(JQ신도4, JQ신평1, JQ일과3) 6공, 조천유역 1개소(JQ신촌4) 1공, 한림유역 1개소(JQ금악5) 1공, 그리고 한경유역 1개소(JQ금악6) 2공으로, 신규 관측망 6개소 10공을 선정하였으며, 기존 시설 1개소(JH중문3)는 배경수질측정망으로 활용하였다(Fig. 1).
수질분석 및 지수평가
지하수 수질분석
연구대상 지역에 대한 지하수 수질자료는 2016년부터 2020년까지 총 5년간 조사된 농업용 공공관정 지하수 개발 ‧ 이용시설 사후관리 이행결과 자료(KRC-J, 2021)를 참고하였으며, 선정된 관측정 10공뿐만 아니라 이들 주변 반경 1 km 내 분포하는 농업용 공공관정 22공에 대한 자료도 포함하였다. 수질검사는 시추조사 완료 후 5항목 1회, 양수시험 중 46항목 1회, 그리고 양수시험 후 5항목 1회 등 총 3회로 실시하였으며, 양수시험 중 시료채취는 일정율 양수시험 과정에서 수중모터펌프가 가동되기 시작한 후 일정 시간이 경과한 후 실시하였다.
DRASTIC 지수 평가
DRASTIC 지수는 지하수 오염에 대한 취약성과 민감성을 상대적으로 평가하는 방법으로 미국 EPA에서 개발하였다(Aller et al., 1987). DRASTIC 모델에 필요한 입력자료는 지하수위(D), 함양량(R), 대수충매질(A), 토양매질(S), 지형경사(T), 비포화대매질(I), 수리전도도(C)가 있으며, 각 인자에 대해 weight와 range 그리고 ratings으로 수치를 부과하여 일정한 지역에서의 DRASTIC 지수를 산출하고 이 지수를 비교하여 타 지역에 대한 상대적인 지하수 오염 가능성을 평가한다(Woo, 1994). DRASTIC 지수는 다음 식 (1)을 이용하여 계산할 수 있으며, 각 인자들의 등급과 가중치를 곱한 값을 모두 합산한다.
여기서, 는 1~7(DRASTIC) 각 요소, 는 해당 요소의 등급(rating), 는 해당 요소의 가중치(weight)이다.
일반적인 평가방법에서 DRASTIC 지수는 23~226의 범위에 있으며, 농업지역에서 농약에 의한 오염가능성을 고려할 경우는 23~256의 범위를 갖는다(Han, 1998; Lee et al., 2006). DRASTIC 지수는 값이 클수록 상대적으로 지하수 오염 가능성이 높고, 작으면 지하수 오염 가능성이 상대적으로 낮음을 의미한다(Jeong, 2018; Table 1).
Table 1.
Classification of groundwater contamination vulnerability based on DRASTIC Index values (after Lee, 2008)
| Index values | Contamination vulnerability |
| >180 | High |
| 160~179 | Moderately high |
| 120~159 | Moderate |
| 100~119 | Moderately low |
| <99 | Low |
WELCUP 지수 평가
Song et al.(2021)은 질산성질소 오염원 인자와 오염지시자를 포함한 6가지 인자들로 구성된 오염도 평가 기준(WELCUP)을 제시한 바 있다. WELCUP 지수는 유역 특성(watershed), 해발고도(elevation), 토지이용 특성(land use), 관정별 오염 현황(contamination degree), 이용량(groundwater use), 시료 채수 시기(period for sampling) 등 대표 문자를 조합한 것으로 지하수 내 질산성질소 오염에 대한 상대적인 차이를 평가하기 위해 각 인자에 가중치, 범위, 등급을 수치로 부여하였고, 21~108점 범위로써 값이 높을수록 질산성질소 오염도가 높은 관정임을 알 수 있다.
WELCUP 지수의 가중치는 관정별 질산성질소 농도(C)와 유역(W) 인자가 6점과 5점으로 가장 높고, 질산성질소의 잠재 오염원으로 작용하는 토지이용 특성(L) 및 질산성질소 농도가 상대적으로 높을 가능성이 큰 상위지하수 유입의 영향(P)이 각각 4점과 3점, 상대적으로 영향이 적은 해발고도(E)와 지하수 이용량(U)은 각각 2점과 1점으로 부여된다(Table 2). WELCUP 지수는 다음의 식 (2)를 이용하여 계산할 수 있다.
여기서, 는 1~6(WELCUP) 각 요소, 는 해당 요소의 등급(rating), 는 해당 요소의 가중치(weight)이다.
Table 2.
Assigned weights and rating values for WELCUP index features (after Song et al., 2021)
연구결과
수질분석 결과
수질자료 분석은 관측정 10공 외 주변 농업용 관정을 포함하여 총 32공에 대해 실시하였다. 연구지역의 질산성질소(NO3-N) 농도는 JQ신도4 지구에서 높게(>30 mg/L) 나타났으며, 농업용수 수질기준(20 mg/L)을 초과하는 지하수 관정은 JQ 신도4지구 하류부 관정 2공(D-103, D-144)으로 나타났다. 또한, 상대적으로 농도가 높아 수질오염이 의심되는 관정은 JQ 신도4지구 주변지역 관정 1공(D-183)과 JQ신평1지구 2공(D-107, D-131), 그리고 JQ일과3지구 1공(D-113)으로 판단된다(Table 3).
Table 3.
Temporal variations in nitrate nitrogen (NO3-N) concentrations in selected wells (JQ Sindo4, JQ Sinpyeong1, JQ Ilgwa3) from 2016 to 2020 (after KRC-J, 2021)
수화학유형 평가
Piper diagram를 이용한 수화학 유형 분석은 지하수의 화학적 특성을 표시하는데 널리 쓰이는 수단으로 지하수 내 주요 양이온과 음이온의 당량농도(meq/L)를 비율로 나타냄으로써 수화학 유형을 도출 및 분석하고, 주요 수화학 유형 인자를 통해 그 특성을 평가하여 지하수의 유형(type)을 구분하는데 이용된다(Piper, 1944). 지하수 수질유형은 대표적인 양이온과 음이온으로 나누어 유형을 분류하였다. 양이온(Ca2+, Mg2+, Na+, K+) 4개 항목과 음이온(Cl-, NO3-, HCO3-, SO42-) 4개 항목 등, 총 8개 항목을 지하수의 수질 특성에 따라 4가지 유형으로 분류하고, 이를 파이퍼도(Piper diagram)에 도식화하였다(Fig. 2).

Fig. 2.
Piper diagram showing the hydrochemical types of groundwater samples from monitoring wells (after KRC-J, 2021).
수화학 유형 평가를 이용한 지하수의 수질 유형 분석결과 Ca-HCO3가 27.3%, Ca-NO3은 18.2%이며, Na-HCO3가 54.5%로 가장 많은 것으로 나타났다(Table 4). 지구별 세부 분석결과, 서서귀지구(JH중문3)와 대정2지구(JQ신평1)는 일반 담수 영역(Ca-HCO3 유형)에 도시 되었다. 반면, 대정1지구(JQ신도4)는 Ca-NO3 유형으로, 질산염의 영향이 나타난다. 질산염은 비료의 사용이나 암모니아의 분해에서 발생되며, 암모니아는 가축 및 인간의 활동에 의해 발생하는 폐수로부터 기인하는 것으로 알려져 있다. 또한, 대정3지구(JQ일과3)와 조천지구(JQ신촌4)는 Na-HCO3 유형으로 농약 및 비료에 의한 영역((Na, K)-HCO3 유형)에 도시되었다. 한편, 양음이온 분석 시 NO3-N과 Ca, Mg 같은 이온은 화학비료 및 분뇨에서 비롯될 수 있는 것으로 알려져 있다(Yoon et al., 2020).
Table 4.
Classification and proportion of major hydrochemical types in the studied wells (after KRC-J, 2021)
| Ca - HCO3 | Na - HCO3 | Ca - NO3 | Total | ||||
|
Number of samples |
Proportion (%) |
Number of samples |
Proportion (%) |
Number of samples |
Proportion (%) |
Number of samples |
Proportion (%) |
| 3 | 27.3 | 6 | 54.5 | 2 | 18.2 | 11 | 100.0 |
DRASTIC 지수 평가결과
DRASTIC 지수 평가를 위해 입력 인자 중 지하수면까지의 깊이(D)와 대수층의 구성물질(A), 그리고 비포화대 구성물질(I)은 시추 주상도 자료를 분석하여 결정하였으며, 토양의 구성물질(S)과 지형 경사(T)는 농촌진흥청에서 제공하는 흙토람 토양환경지도를 이용하였다. 지하수 함양량(R)은 강우량에서 유출량, 증발산량, 직접유출량을 뺀 값으로 대수층으로 침투되는 물의 양으로, 연구지역의 함양량은 제주도 지하수정보관리시스템에서 제공하고 있는 20년 평균 유역별 수문분석자료를 활용하였다. DRASTIC 인자 중 가장 구하기 어려운 수리전도도(hydraulic conductivity)의 경우, 각 관측정의 양수시험 자료를 활용하여 범용 프로그램인 AQTESOLV를 이용하여 산출하였다.
연구지역 관측정 10공의 DRASTIC 지수 산출 결과, 대정읍 지역은 142~155의 범위를 보여주며, 조천읍 지역은 153으로 나타났다. 반면, 한림읍 지역은 다른 지역에 비해 상대적으로 낮은 122~146의 범위를 나타낸다(Table 5). 이는 DRASTIC 지수 범위에 따른 오염등급에서 중간 수준의 오염가능성을 보이는 것으로(Table 1), 제주도의 DRASTIC 지수가 육지부에 비하여 상대적으로 높은 특성과는 어느 정도 부합하지만(Baek et al., 2021), 실제 대정1지구(JQ신도41, JQ신도42)의 질산성질소 농도가 높게 나온 수질검사 결과와는 차이가 나는 결과를 보이고 있다. 따라서, 전통적인 DRASTIC 지수에 의한 오염평가 방법으로는 연구지역 중 일부 관측정의 지하수 오염현상에 대한 충분한 설명이 어렵다는 한계가 있는 것으로 판단된다.
Table 5.
Summary of DRASTIC index values and hydrogeological input parameters for monitoring wells
WELCUP 지수 평가결과
본 연구에서 WELCUP 등급은 Song et al.(2021)이 제시한 등급을 바탕으로 하였다. 유역특성(W)은 16개 유역내에 위치한 5,109공의 총 37,379회의 질산성질소 수질분석 결과를 이용하여 최대 질산성질소 농도값의 중앙값을 기준으로 5가지 등급으로 구분하였고, 해발고도 특성(E)은 관정별 질산성질소 최대농도의 해발고도 대표 구간별 빈도분석 결과를 근거로 8개 그룹에 대한 등급을 부여하였다. 토지이용 특성(L)은 환경부 토지피복도의 대분류 기준을 적용하여 총 7가지로 분류하였으며, 관정별 오염 현황(C)은 오염범위별 관정 분포현황을 기준으로 6개 그룹으로 구분하였다. 관정별 이용량 특성(U)은 2014~2019년 기간의 관정별 평균 월별 이용량 자료를 기초로 하여 빈도분석을 통해 6개 그룹으로 범위를 구분하고, 시료 채수 시기(P)는 3개월 단위로 구분하여 4개 그룹으로 등급을 부여하였다(Song et al., 2021).
관측정 10공에 대한 WELCUP 지수 산출 결과, 60~98점의 범위를 보이며(Table 6), 이 중 대정1지구는 98점으로 지수 만점인 108점에 근접해 있어 질산성질소에 의한 지하수 오염도가 상대적으로 높은 지역임을 알 수 있다. 대정1지구 관측정 2공 모두 질산성질소 농도가 다른 관측정에 비해 높은 값을 보이는 수질검사 결과와도 부합하는 결과를 보이고 있어, WELCUP 지수는 지하수오염 평가에 있어서 지수가 높을수록 질산성질소에 의한 지하수 오염도가 높고 지수가 낮을수록 오염도가 낮다는 상대적인 평가도구로 활용이 가능한 것으로 판단된다.
Table 6.
WELCUP Index values for each monitoring well based on six weighted factors
오염평가 지수 간 상관관계 분석
Han(1998)은 국내의 경우 지하수위가 매우 깊은 지역(고지대)을 제외한 고도가 낮은 평지에서의 DRASTIC 평가법은 활용에 큰 무리가 없다는 의견을 제시하였다. 또한, Lee(2008)는 일반적인 DRASTIC 지수값과 질산성 농도 사이에 유의미한 상관관계가 없다는 연구결과를 발표하였으며, 육지부와 다른 수리지질학적 조건을 가지고 있는 제주도에 적합한 지하수 오염 위해성평가 모델 개발에 대한 연구를 수행한 바 있다. Lee(2008)가 제시한 모델은 지하수위에 대한 평가 기준에서 기존 DRASTIC 모델과 가장 큰 차이점을 보여준다. 기존 DRASTIC 모델은 지하수위 30.5 m 이상을 최저 점수로 구분하고 있으나, 제주도의 경우 지하수위가 육지부에 비해 대체로 매우 깊게 형성되는 부존 특성을 보이므로 이를 감안하여 지하수위 적용 기준을 보다 깊은 범위로 확대하였다(Table 7).
이 절에서는 제주지역 지하수위의 특성을 감안하여 DRASTIC_jeju 지수를 추가로 산출하고, 질산성질소 농도 및 WELCUP 지수와 비교하여 각 변수간의 상관관계를 분석하고자 한다. 분석에 있어서 WELCUP 지수 산출 시 관정별 오염 현황(C) 요소의 값은 제외하고 산정하였다. 이는 C 항목이 종속변수인 질산성질소 농도를 일정 구간으로 나누어 점수화한 값으로, 직접적인 실측값은 아니지만 해당 변수의 정보를 간접적으로 포함하고 있기 때문이다. 즉, WELCUP 지수의 일부 요소가 질산성질소 농도와 상관관계를 내포하고 있어서 독립 변수로 활용할 경우, 통계적 의존성(statistical dependence) 문제로 인해 예측력은 높아지지만 해석의 왜곡이 발생할 수 있기 때문이다. 이에 따라 회귀모형에서의 설명력 과대추정 가능성을 피하기 위하여 본 연구에서는 C 항목을 제외한 WELCUP(C_ex) 지수를 산출하였다.
Table 7.
Comparison of groundwater level rating criteria between the original DRASTIC index and the modified DRASTIC_jeju index reflecting deep aquifer conditions on Jeju Island (after Lee, 2008)
DRASTIC_jeju 지수를 반영한 결과, JQ금악5와 JQ금악62를 제외하면 전체적으로 값이 유의미하게 증가하였다. 기존 DRASTIC 평가 결과인 중간수준의 오염가능성에서 비교적 높음에서 매우 높음 수준의 오염가능성을 보이고 있어 상대적으로 지하수 오염 가능성이 높아진 것으로 나타났다. 반면, WELCUP(C_ex) 지수는 앞 절에서 평가한 값보다 다소 낮은 48~62점의 범위로 분포하는데, 이는 질산성질소와 관련된 인자를 제거한 효과에 기인하는 것으로 판단된다(Table 8).
Table 8.
Comparison of the WELCUP(C_ex), DRASTIC, and DRASTIC_jeju indices and measured NO3-N concentrations
한편, DRASTIC 지수를 비롯한 각 변수들의 관계가 유의한지를 알아보기 위해 상관분석을 실시하였다(Table 9). 상관분석 결과, WELCUP(C_ex) 지수와 DRASTIC_jeju의 경우, 상관계수 r = 0.912로 나타나 강한 양의 상관관계를 보이고 있어 두 변수가 함께 증가하는 패턴을 보인다.
Table 9.
Correlation coefficients between groundwater vulnerability indices and nitrate concentrations
| Variable (Index) | WELCUP(C_ex) | DRASTIC | DRASTIC_jeju | NO3- | NO3-N |
| WELCUP(C_ex) | 1.000 | - | - | - | - |
| DRASTIC | 0.655 | 1.000 | - | - | - |
| DRASTIC_jeju | 0.912* | 0.715 | 1.000 | - | - |
| NO3- | 0.370 | 0.497 | 0.449 | 1.000 | - |
| NO3-N | 0.271 | 0.431** | 0.317 | 0.986 | 1.000 |
DRASTIC 지수와 DRASTIC_jeju는 r = 0.715로 비교적 강한 양의 상관관계를 보이며, NO3-(질산이온) vs NO3-N(질산성 질소)의 관계는 r = 0.986으로 매우 강한 양의 상관관계를 보이고 있어, 거의 동일한 데이터 값을 나타낸다. 즉, NO3-와 NO3-N을 함께 사용하게 되면 중복될 가능성이 높은 것을 알 수 있다.
반면, WELCUP(C_ex) 및 DRASTIC_jeju지수와 NO3-N의 관계는 r = 0.271, r = 0.317로 약한 양의 상관관계를 보이고 있어, NO3-N을 설명하기는 어려운 것으로 판단된다. 그러나, DRASTIC 지수와 NO3-N의 상관관계는 r = 0.431로 다른 지수들에 비해 비교적 유의한 관계를 보이므로 관측정 데이터 값을 더 많이 확보하여 비교해 볼 필요가 있는 것으로 사료된다.
종합하면, 지수간 상관관계의 경우, WELCUP(C_ex) 지수는 DRASTIC_jeju 및 DRASTIC 지수와 비교적 강한 상관관계가 있으나, NO3-N과는 약한 상관관계를 가지는 특징을 보여준다. 반면, DRASTIC_jeju는 DRASTIC 지수와 강한 상관관계를 가지나 NO3-N과는 약한 상관관계를 가지며, DRASTIC 지수는 NO3-N과 유의한 상관관계가 있는 것으로 나타난다.
앞 절에서 수행한 상관분석 결과와 비교하기 위하여 단순 회귀분석을 실시하였으며, 회귀식 및 결과를 정리하면 다음과 같다.
① NO3-N = -49.90 + [(0.41) × DRASTIC], Adj. R2 = 0.084로 매우 낮은 설명력을 가짐, p-value: 0.213으로 유의하지 않음(0.05보다 큼)
② NO3-N = -17.45 + [(0.48) × WELCUP(C_ex], Adj. R2 = -0.042로 매우 낮은 설명력을 가짐, p-value: 0.448로 유의하지 않음(0.05보다 큼)
③ DRASTIC_jeju = -6.38 + [(3.07) × WELCUP(C_ex)], Adj. R2 = 0.809로 매우 높은 설명력을 가짐, p-value: 0.0002로 유의함(0.05보다 작음).
또한, 독립변수를 2개 이상 설정하여 다중 회귀분석을 실시한 결과는 다음과 같다.
① NO3-N = -16.07 + [(0.21) × DRASTIC_jeju] − [0.18 × WELCUP(C_ex)], Adj. R2 = -0.153으로 매우 낮은 설명력을 보임, p-value: 0.649(DRASTIC), 0.906(WELCUP(C_ex))로 유의하지 않음.
② DRASTIC_jeju = -3.87 + [(0.14) × NO3-N] + [3.01 × WELCUP(C_ex)], Adj. R2 = 0.789로 높은 설명력을 보임, p-value: NO3-N은 0.649로 유의하지 않으나, WELCUP(C_ex)은 0.0008로 유의함.
NO3-N의 다중 회귀분석 결과는 단순 회귀분석과 차이가 없으나 DRASTIC_jeju는 단순회귀분석과 유사한 결과를 보여준다. 단순 회귀분석 및 다중 회귀분석 결과를 정리하면 Table 10과 같다.
Table 10.
Summary of linear and multiple regression results for predicting NO3-N concentrations using index variables
오염평가 지수 및 질산성질소와의 상관분석 결과, DRASTIC_jeju 지수와 WELCUP(C_ex) 지수 간의 관계에서만 유의미한 결과가 도출되었다. 한편, 질산성질소와 상기한 두 지수 간의 회귀분석에서는 낮은 설명력을 보이는 결과가 도출되었는데, 이는 해당 지수들이 수리지질학적 오염 취약성이나 유역 특성 등은 반영하지만 실제 오염원의 공간적 분포나 농업현황 및 축산시설 분포 등의 인위적 요인을 정량적으로 포함하지 못하기 때문인 것으로 해석된다. 반면, DRASTIC_jeju와 WELCUP(C_ex) 지수는 질산성질소와 관련된 연구지역의 오염을 예측하기는 어려운 것으로 보이나, WELCUP(C_ex) 지수로 DRASTIC_jeju 지수값을 예측하기에는 높은 설명력을 가지는 것으로 판단된다.
오염원 분포에 따른 상관관계
오염원과 오염평가 지수와의 상관관계 분석을 위하여 비점오염원인 농경지 면적과 점오염원의 자료를 추가하였다. 또한, 자료의 신뢰도 향상을 위해 관측정 10공 반경 1 km 내 기설관정 22공을 포함하여 총 32공에 대하여 회귀분석을 실시하였다. 분석에 앞서 기설관정 22공에 대한 DRASTIC과 WELCUP 지수를 새로 산출하였으며, 각 공별 질산성질소 농도값은 농업용 공공관정 지하수 개발 ‧ 이용시설 사후관리 이행결과 자료(KRC-J, 2021)를 활용하였다. 그리고, 관측정이 위치하는 지점의 마을(리)별 농경지 면적과 관측정 반경 1 km 내에 분포하는 개인하수처리시설 182개소 및 축산폐수배출시설 90개소와의 거리를 추출하여 회귀분석에 반영하였다.
농경지 면적은 제주도 수자원종합관리계획(JSSGP, 2018) 자료를 활용하였으며, 점오염원과 관측정 10공을 포함한 기설관정 22공과의 이격거리는 평면 좌표계인 TM 좌표(KRC-J, 2021)를 기반으로 하여 유클리디안 거리(Euclidean distance) 공식을 적용하여 계산하였다. TM 좌표계에서의 두 점(x1, y1)과 (x2, y2) 사이의 거리는 다음의 식 (3)과 같이 계산된다.
질산성질소 농도 예측을 위한 회귀모델의 독립변수로는 농경지 면적과 오염원까지의 거리 및 거리제곱의 역수(1/d, 1/d2), 그리고 오염평가 지수를 이용하였다. 회귀분석은 단순회귀에서 다중회귀까지 단계별로 수행하였으며, 모델의 수정 결정계수(Adj. R2)와 유의확률(p-value)을 기준으로 유의미한 변수 조합을 도출하고자 하였다.
오염평가 지수만 독립변수로 수행한 질산성질소에 대한 단순 회귀분석의 경우, 앞 절에서의 결과와 마찬가지로 3개 지수 모두 유의미한 결과를 얻을 수 없었다(Table 11). 이러한 결과는 DRASTIC 지수가 오염원에 대한 항목이 포함되지 않은 수리지질학적 인자만을 적용한 것과(Kim et al., 2008; Lee et al., 2008), 질산성질소 농도와 관련된 C 인자를 제외한 WELCUP(C_ex) 지수를 적용한 것에 기인하는 것으로 판단된다. 즉, 지하수 오염평가 지수는 지하수 관정이 위치하는 특정 지역에 대한 오염의 취약성은 반영하지만, 특정 지하수 관정의 직접적인 오염 예측에는 설명력이 부족하다고 할 수 있다.
Table 11.
Results of simple regression analyses using groundwater vulnerability indices as predictors
앞 절에서의 오염평가 지수 단독 분석과는 달리 오염원 자료를 포함하여 다중 회귀분석을 실시한 결과, 질산성질소 농도는 관정 분포 지역의 농경지 면적과 오염원과 관정 간의 거리 정보, 특히 최소거리의 역수 및 제곱 역수와 밀접한 관계가 있는 것으로 나타났다. 결정계수(R2) 기준으로 0.4 이상인 모델 조합 4개가 확인되었으며, 그 중 3개 조합은 수정 결정계수(Adj. R2) 기준에서도 0.48~0.49 수준의 높은 설명력을 보이고 있어 이는 농경지 면적과 오염원과의 거리 기반 지표(1/d 또는 1/d2) 조합이 질산성질소 농도 예측에 매우 유의미함을 의미한다. 반면, 농경지 면적과 WELCUP(C_ex) 지수의 조합은 결정계수 기준으로 약 42.2%의 설명력을 가지며, WELCUP(C_ex) 변수의 p값은 0.059로 유의수준 0.05를 약간 초과하였다. 이는 전통적 기준에서는 통계적으로 유의하지 않지만 유의성 경계(borderline significance)에 위치한 변수로, 현장 적용에 있어 해석 가능한 범위로 간주될 수 있어 실무적 판단에서의 보조적 해석 지표로서의 활용 가능성이 있다(Table 12). 한편, 오염원 자료를 포함한 다중 회귀분석 결과에 근거하여, 통계적으로 유의미한 4가지 모델의 회귀식을 산출하여 각 모델별로 계산한 질산성질소 예측값과 실제 측정한 값과의 상관관계를 비교하였다(Fig. 3).
Table 12.
Performance of four two-variable multiple regression models using size of agricultural area and distance to pollution source as metrics
질산성질소 농도를 예측하기 위한 4가지 모델의 회귀식은 기본적으로 y = ax1 + bx2 − c의 형태이며(y는 종속변수, x1, x2는 독립변수, a, b, c는 상수(절편값)), 종속변수인 질산성질소 농도와 독립변수인 농경지 면적(agri_area), 개인 하수처리시설과의 최소거리의 역수(1/d(min)_pr), 축산폐수 배출시설과의 최소거리 제곱의 역수(1/d2(min)_lv), 개인 하수처리시설과의 최소거리(d(min)_pr), 그리고 WELCUP(C_제외) 지수와의 조합으로 구성되어 있다(Table 12). 회귀식에서 질산성질소 예측값(predicted NO3-N)의 단위는 mg/L, 농경지 면적은 hectare(ha), 그리고 오염원 시설과의 거리(d)는 meter이며, 4가지 모델의 회귀식은 아래와 같다.
① Model 1 : predicted NO3-N = (0.0189 × agri_area) + (4,915.59 × 1/d(min)_pr) − 6.00
② Model 2 : predicted NO3-N = (0.0239 × agri_area) + (3,572,913.71 × 1/d2(min)_lv) − 6.72
③ Model 3 : predicted NO3-N = (6,616.41 × 1/d(min)_pr) + (0.0142 × d(min)_pr) − 4.08
④ Model 4 : predicted NO3-N = (0.0373 × agri_area) + (0.3365 × WELCUP(C_ex)) − 28.03
또한, 각 모델별로 계산된 질산성질소 예측값과 실측값과의 비교를 통해 각 모델의 예측오차를 검토하였으며(Fig. 4), 예측오차 평가를 위하여 평균절대오차(mean absolute error, MAE)(식 (4))와 평균제곱근오차(root mean square error, RMSE) 식 (5)를 산츨하였다(Choi et al., 2012; Kim and Lee, 2023; Lim, 2023).
여기서, 는 실제값, 는 예측값이다.
평균절대오차(MAE)는 각 데이터 포인트의 절대적인 차이의 평균값으로 모든 오차에 동일한 가중치를 부여하기 때문에 큰 오차의 영향을 덜 받지만, 평균 제곱근 오차(RMSE)는 각 데이터 포인트의 차이의 제곱을 평균한 후 제곱근을 취한 값으로 큰 오차에 가중치를 부여하므로 큰 오차에 더 민감하여 이상치(outlier)가 있는 경우 MAE보다 더 큰 영향을 받는다(Kim and Lee, 2023). 따라서 큰 오차가 많지 않으면 MAE와 RMSE의 차이가 적게 나게 되며, 반대로 큰 오차가 많을 경우에는 RMSE가 MAE보다 더 커지게 된다.
상대초과 오차율(relative excess error, REE)은 실제 모델의 예측 오차가 분산이 큰지, 안정적(robustness)인지를 비교하는데 매우 유용한 지표이다. 즉, 모델 예측값의 분산 정도를 직관적으로 파악할 수 있는 지표로 이에 대한 공식적인 해석기준은 기존 문헌에 명확하게 제시되어 있지 않지만, 본 연구에서는 RMSE와 MAE의 활용 방식에 대한 선행 연구(Choi et al., 2012)를 참고하여 예측 안정성 해석을 위한 경험적 기준을 제안하였다(Table 13).
Table 13.
Interpretation criteria for relative excess error (REE) to evaluate prediction stability of regression models based on the difference between RMSE and MAE
4개 모델의 예측오차 분석 결과, 모델4의 경우 상대적으로 가장 낮은 설명력(Adj. R2)을 보였으나(Table 12), 예측 오차의 분포는 상대적으로 안정적으로 나타났다. 이는 통계적으로 경계선상의 유의확률값을 보이는 독립변수인 WELCUP(C_ex) 지수가 일부 정성적 요소나 공간적 평균 경향을 반영함으로써, 이상 예측을 억제하는 효과를 제공한 것에 기인하는 것으로 판단된다. 즉, 나머지 모델 3개와 비교 시 질산성질소 설명력은 부족하지만, 예측된 값 자체는 급격하게 벗어나지 않고 실측값 주변에 비교적 고르게 분포되어 있다(Fig. 3).
또한, 모델의 예측값과 실측값 간의 상관계수(r)는 0.7 이상으로 나타나 비교적 강한 양의 상관관계를 보이고 있으며, 이는 모델 예측값이 실측값의 경향을 전반적으로 잘 반영하고 있음을 의미한다. 4개 모델의 예측 성능을 평가하기 위한 평균절대오차(MAE)와 평균제곱근오차(RMSE)는 각각 4.12~5.33 mg/L, 6.84~7.53 mg/L이며, 상대초과 오차율(((RMSE-MAE)/MAE))은 0.412~0.670 수준으로 나타났다(Table 14). 이는 예측값이 평균적으로 실제값에 비교적 근접하나, 일부 이상치(outlier)에 의해 예측 오차가 분산되는 경향이 있음을 시사한다(Fig. 4).
4개 모델의 오차검토 결과, 모델1과 2는 REE가 높아(0.50<) 상대적으로 큰 오차가 있을 가능성이 높은 반면, 모델3과 4는 모델1, 2에 비해 REE가 낮아(0.4≤) 예측값이 심하게 튀지 않고, 평균적인 오차 수준에서는 안정적인 것으로 상대적으로 오차가 일정하고 큰 이상치가 적은 것으로 나타났다(Table 14). 특히, 모델3과 4는 상대적으로 낮은 REE를 나타내며 이상값(outlier)에 강건한 예측 안정성을 보이는 특성을 보여, 질산성질소 고농도 국지 오염에 민감하지 않은 예측 모델로서의 활용 가능성을 확인할 수 있었다.
Table 14.
Correlation coefficient between measured and predicted NO3-N concentrations and prediction error analysis
결 론
본 연구는 제주도 서부 지역 지하수의 질산성질소(NO3-N) 농도에 영향을 미치는 주요 요인을 분석하고, 이를 기반으로 한 예측 가능한 회귀모델을 제시하는 데 목적이 있다. 수질분석 결과, 대정지역 일부 관측정에서 질산성질소 농도가 30 mg/L를 초과하며, 수화학 유형 평가에서는 Na-HCO3형과 Ca-NO3형이 주요한 오염 유형으로 농약 및 비료, 그리고 폐수와 밀접하게 관련됨이 확인되었다.
오염취약성 평가 지수 산출 결과, 대정지역 일부 관정에서 높은 값을 보였으며 이는 실제 수질오염 공간 분포와도 유사한 경향을 보여주었다. 그러나 오염평가 지수와 질산성질소 농도 간 회귀분석에서는 설명력이 낮고(Adj. R2 < 0.1), 통계적으로도 유의하지 않아(p > 0.2) 질산성질소 예측력에 한계가 있는 것으로 나타났다.
이에 따라 농경지 면적과 오염원(개인하수처리시설, 축산폐수배출시설)과의 거리 기반 지표(1/d, 1/d2 등)를 포함한 2개 변수 조합 회귀모델을 구축하였으며, 그 중 3개 모델에서 통계적으로 유의한 설명력(Adj. R2 ≈ 0.49, p < 0.05)을 확보하였다. 특히, 농경지 면적과 오염원 간의 거리의 역수 또는 거리 제곱의 역수를 조합한 모델은 지하수 관정 주변의 비점오염원(농업활동)과 점오염원(하수처리시설 등)으로부터의 오염확산 가능성을 공간적으로 반영할 수 있다는 점에서 해석의 타당성이 높다. 또한, 단일 지하수 오염평가 지수만을 활용한 모델에 비해 통계적 유의성과 설명력이 모두 우수하게 나타났다.
예측오차 분석(MAE ≈ 4.1 mg/L, RMSE ≈ 6.9 mg/L)을 통해 모델의 신뢰도를 평가하였으며, 일부 모델에서는 이상치에 대한 예측 안정성(REE ≈ 0.41)도 확인되었다. 이러한 결과는 지하수 오염 예측 시 전통적인 지수 기반 모델의 한계를 보여주는 동시에, 거리 기반 공간변수가 질산성질소 농도 예측에 효과적임을 입증한 것이다. 특히, 단순 2개 변수 회귀모델은 해석 가능성이 높고 이상치의 영향도 상대적으로 안정적으로 억제하는 특성이 있어 현장 적용 가능성이 높은 것으로 판단된다.
따라서 본 연구는 기존의 오염평가 지수 기반 평가의 한계를 보완하고, 농업활동 및 오염원 분포를 반영한 단순 회귀모델을 통해 제주 지역의 질산성질소 발생 원인을 정량적으로 설명할 수 있는 기반을 제시하였다. 향후에는 지하수 유동 방향, 대수층 경계조건 등과 같은 수리지질학적 인자를 통합한 고도화된 예측모델 개발이 요구되며, 본 연구에서 제시한 단순 회귀모델은 제주 지역 지하수 수질관리를 위한 정책 수립과 오염취약지역 선별의 실질적 분석 도구로 활용될 수 있을 것으로 기대된다.





