본문 바로가기

뉴스

한국도 돌발 홍수 심한데...구글 지도, 韓 제외 이유가[김창영의 실리콘밸리Look]

댓글0
구글, ‘그라운드소스’ 출시
24시간 전 홍수 경보 알려
150개국 20억명에 서비스
한국은 기상법 규정상 빠져
서울경제

구글이 12일(현지 시간) 도심 홍수 예측을 돕는 새로운 인공지능(AI) 시스템인 ‘그라운드소스(Groundsource)’를 출시했다. 그라운드소스는 공개된 보고서와 각 지역 뉴스 보도, 구글 지도를 활용해 과거 홍수 발생 이력을 기반으로 데이터를 구축하고 최대 24시간 전까지 홍수 경보 알림을 제공한다. 한국도 이상 기후로 돌발 홍수 피해가 갈수록 커지고 있지만 기상법 규정 때문에 서비스 대상에서 제외됐다. 보도자료, 사전 설명회, 질의 내용을 종합해 주요 내용을 Q&A 형식으로 정리했다.

서울경제

그라운드소스 개발 배경은
세계기상기구(WMO)에 따르면 전 세계 홍수 관련 사망자 약 85%는 돌발 홍수가 원인이었다. 돌발 홍수는 일반적으로 폭우가 내린 후 6시간 이내 발생해 도시의 거리를 급류로 뒤덮고 매년 5000명 이상의 목숨을 앗아간다. 조기경보 시스템(EWS)은 지역사회 안전을 지키고 정보를 제공하는 데 필수적이다. EWS는 12시간의 사전 경보만으로도 돌발 홍수 피해를 60%까지 줄일 수 있다.

그러나 국가 간 심각한 경보 격차가 존재한다. 선진국들은 탄탄한 예측 시스템을 통해 혜택을 보고 있는 반면 개발도상국에서는 다중 재해 조기경보 시스템 이용 비율이 절반에도 못 미친다. 수십억 명이 생사를 가르는 사전 경보를 받지 못하고 있다.

어떤 의미가 있는건지
구글 플랫폼(Flood Hub)에서 150개국 이상 20억 명을 대상으로 정보를 제공한다. 각 지역에서 재난 발생 전 대비를 할 수 있다. 특히 과거 돌발 홍수 데이터가 부족했던 도시에서 방대한 오픈소스(개방형) 벤치마크(기준)을 제공한다. 그라운드소스의 AI 기반 접근이 산사태, 폭염 등 다른 자연 재해에도 적용될 수 있다.

어떻게 정보를 취합했나
그라운드소스는 AI로 수십 년치 공공 보고서 수백만 건과 150개국 이상에서 발생한 260만 건 이상의 과거 홍수 사건을 분석한다. 다음 단계로 구글 맵스를 사용해 각 사건의 정확한 지리적 경계를 파악하고 돌발 홍수에 초점을 맞춘 데이터를 구축한다. 데이터를 사용해 도시 지역의 돌발 홍수를 최대 24시간 전 예측할 수 있다. 새 모델은 제미나이(구글 AI 모델)로 학습됐다.

제미나이로 어떻게 학습시켰나
역사적으로 발생한 모든 홍수 관련 뉴스 기사를 모아서 모델에 입력했다. 지금까지는 그런 식으로 진행했다. 홍수를 언급한 모든 정보를 취합했고 제미나이로 그 정보를 분석하고 처리했다.

실제 홍수였는지 그리고 언제 발생했는지와 같은 시간적 세부 사항을 이해하려 했다. 예를 들어 보고서에 ‘지난 화요일’이라고 쓰여 있다면 화요일이 언제인지 정확히 알아야 한다. 실제로 언제 발생했는지를 정확히 수집하려고 했고 공간적 정확성, 즉 어디에서 발생했는지도 확인하고자 했다.

본질적으로 세 가지 정보를 추출함으로써 우리는 이 데이터셋을 만들 수 있었고, 데이터셋에는 시작 시점과 종료 시점, 그리고 실제 위치가 포함돼 있다. 예를 들어 2020년에 르완다에서 몇 번의 홍수가 발생했는지 알고 싶다면 이 데이터셋을 대조해 확인할 수 있다.

모델을 훈련할 때는 다음과 같은 방식을 거쳤다. 지난주 날씨, 앞으로 예상되는 날씨, 지역 특성, 토양, 수문, 분지 등에 관한 정보들을 사용하고자 했다. 그리고 모델에게 ‘홍수가 발생할 것으로 예상되는 지역의 예측 결과를 제공해 주세요’라고 말했다. 또 좋은 데이터 세트 예시가 어떤 것인지, 홍수가 실제 발생하는 지역 상황을 보여주는 데이터셋도 제공했다.

데이터 분석이 얼마나 정확한지
데이터셋 내 사건의 약 82%가 올바른 위치와 시간대를 포착한 것을 확인했다. 잘 훈련된 모델에서 18%의 라벨링 오류는 허용 가능한 수준이다. 때로는 위치가 정확하지 않았고, 때로는 시간대가 맞지 않았다. 발생 시점이 며칠 정도 차이가 났을 수도 있다. 18%의 오류는 이런 부분에서 발생했다. 우리는 이러한 다양한 오류들을 걸러냈다. 이 데이터셋을 훈련과 평가에 사용하는 것은 홍수 예측 능력에 실제로 영향을 미치지 않기 때문에 유용하다고 할 수 있다.

뉴스 기반 데이터는 기존에도 존재했는데
과거에도 뉴스 기반 데이터셋이 있었다. 어떤 점에서 더 나아졌는지 묻는다면 대규모언어모델(LLM)을 사용한 필터링과 추출이 진정한 게임 체인저라는 점이다. 이것이 큰 차이이며 정확도를 제공한다.

특정 유형의 사건이 발생할 것을 AI 모델이 예측하려면 과거 데이터셋이 반드시 필요하다. 그라운드소스가 하는 일은 도시 돌발 홍수에 특화된 모델로 구축될 수 있도록 데이터셋을 만드는 것이다. 우리는 260만 건의 데이터는 모델 훈련에 매우 유용하고 중요하다.

뉴스 보도가 적은 곳은 정확도가 떨어질 수 있는데
뉴스에 따라서 다소 정확도가 떨어지거나 다르게 느껴질 수 있다. 150개국에서 수백만 건의 보고서를 수집하고 있기 때문에 그라운드소스 데이터 세트가 지도를 재조정하고 역사적으로 데이터가 부족했던 지역에 정보를 제공하는 데 도움을 준다. 특정 지역에 집중하지만 이를 통해 정보가 부족한 다른 지역에 대해서도 추론이 가능하다.

분석 도구로는 무엇을 사용하나
LLM 외에 유럽중기기상예보센터(ECMWF), 미 해양대기청(NOAA), 구글 딥마인드 기상 모델, 하이드로 아틀라스(Hydro Atlas)의 데이터를 사용한다. 기본적으로 기상 예보와 수문학 데이터를 결합해 지역별 특성을 파악한다.

출시 전 반응은 어땠나
파트너들로부터 정보가 재난 대응 노력에 도움이 된다는 반응을 듣고 매우 고무됐다. 모잠비크 지역 재난 당국 역할을 하는 남아프리카 개발 공동체는 Flood Hub의 베타(시범) 버전에서 홍수 경보를 확인하고 이를 바탕으로 남아프리카 정부에 연락해 사건들을 모니터링해 달라고 요청했다.

한국 제외 이유는
Flood Hub에서는 현재 한국을 지원하지 않는다. 기상법상 과학적 관측 기반 홍수 예보를 일반 대중에게 제공하는 것은 기상청 또는 허가 받은 기관으로 제한돼 있기 때문이다. 현재 우리 모델은 약 150개국에 걸쳐 24만 개 이상의 강 유역 지점을 대상으로 구축돼 있다. 데이터 적용 범위를 확대하기 위해 노력하고 있다.

장기적인 미래도 예측할 수 있나
강 수위가 오를지 내릴지, 그리고 얼마나 오를지 최대 7일 전까지 예측할 수 있다.

지진 예측도 추가될 수 있나
현재 지진 예측에 대해 공유할 내용은 없다. 다만 지난해 안드로이드에서 제공한 조기 지진 경보가 2200만 회 이상 조회됐다는 점은 말씀드린다. 우리는 이미 조기 지진 탐지를 선구적인 기술로 보고 있으며 지상 기반 방법론이 다른 유형의 재난에도 매우 유용할 것으로 기대하고 있다.

구글 검색이나 맵스에 통합되나
현재 검색에 통합하는 작업을 진행 중이지만 아직 적용되지는 않았다. 다른 구글 제품으로도 확장하는 데 관심이 있다. 하지만 현재 예측 정보를 제공하는 곳은 Flood Hub이다.

보완해야 할 점은
돌발 홍수 예측이 현재 도시 지역으로 제한돼 있다. 이는 전 세계 많은 사람들에게 예보를 제공하기 위해 초기 출시를 도시 지역에 집중했기 때문이다. 또 지역 뉴스 보도를 통해 학습한 데이터는 인구가 밀집한 지역일수록 더 많을 수밖에 없다. 아프리카의 많은 국가는 실제 데이터가 부족하다.

서울경제

실리콘밸리=김창영 특파원 kcy@sedaily.com

[ⓒ 서울경제, 무단 전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

서울경제 주요뉴스

해당 언론사로 연결

지금 봐야할 뉴스

  • 노컷뉴스부산 아파트서 조경 작업하던 60대 추락사고로 중상
  • 이데일리정의선 회장, 기아서 첫 보수 54억원 수령..."최대 실적 기여"
  • 서울경제광양, 지금 최대 화두는 ‘경제’…여수광양항만공사 경영신화 주역 ‘박성현’ 재조명
  • 프레시안"아직 존재하지 않지만 발명되어야 할 것은 무엇인가?"

쇼핑 핫아이템

AD