정부가 추진하는 ‘독자 AI 파운데이션모델 프로젝트’ 2차 평가 진출 정예팀이 결정됐다. LG AI 연구원, SK텔레콤, 업스테이지 정예팀은 진출에 성공했지만 네이버클라우드, NC AI 정예팀은 고배를 마셨다. 1차 평가에서 4개 정예팀을 가리겠다고 했던 당초 계획과 다른 결과에 업계 충격도 적지 않다. 네이버클라우드 정예팀이 독자성 문제가 불거지면서 2차 진출이 무산되면서다. 이에 <디지털데일리>가 1차 평가 과정을 돌아보면서 업계 및 전문가들의 목소리를 들어보고 이어지는 2차 평가에 대한 전망을 집중적으로 살펴봤다.<편집자주>
[디지털데일리 오병훈기자] 정부가 ‘독자 AI 파운데이션모델(독파모)’ 프로젝트 추가 정예팀을 모집한다. 1차 평가와 같은 방식으로 선발이 진행되며 선발된 정예팀에게는 현재 2차에 진출한 정예팀과 같은 혜택이 제공된다.
정부 발표 직후 추가 정예팀 선발 적절성에 대한 다양한 의견이 교차하고 있다. 독파모 예산의 효율적인 활용을 위해서는 추가 선발이 불가피하다는 것이 정부 입장이지만 형평성 문제가 지적되고 있다.
이미 2차 평가에 진출한 LG AI 연구원과 SK텔레콤, 업스테이지 입장에서는 이같은 방식이 ‘부전승’처럼 받아들여질 수도 있다. 반대로 추가 선발되는 정예팀 입장에서는 이미 진출에 성공한 정예팀보다 시간적 여유가 부족해 경쟁에서 불리할 수 있다는 시각이다.
추가정예팀이 합류하게 되는 2차 평가 과정에서는 사용자 평가 비중을 늘려야 한다는 의견이 나온다. 벤치마크 점수에 기반한 평가 비중을 줄이고 사용자 평가를 중심으로 활용 우수성 평가 비중을 높여야 한다는 주장이다. 정부는 2차 평가에서도 1차 평가 때와 마찬가지로 벤치마크 점수와 전문가 평가, 사용자 평가 세 가지 측면 평가 방식을 유지하겠다는 입장이다.
◆“행정자원 효율화”vs“공정성 문제”
당초 독파모 프로젝트 2차 평가 과정에는 4개 정예팀을 선발할 예정이었다. 벤치마크 점수와 전문가 평가, 사용자 평가를 통해 산출한 점수로 상위 4개팀을 선정하는 식이다. 그러나 네이버클라우드 정예팀이 독자성 논란에 휘말리게 되면서 3개 팀만 2차 평가에 진출하게 됐다.
정부는 공석을 채우기 위한 추가 정예팀 선발을 예고했다. 기회는 모든 기업에게 제공된다. 1차 평가 참여 여부와 상관 없이 역량 있는 정예팀을 추가로 선발해 그래픽(GPU)·데이터 지원, ‘K-AI 기업’ 명칭 부여 등 기존 참여 정예팀과 같은 혜택을 제공한다.
급작스러운 추가 선발인 만큼 행정 절차도 최소화한다. 독파모 프로젝트에 편성된 행정 자원의 효율적인 활용을 위해 이같은 결정을 내렸다는 것이 정부 설명이다.
류제명 과학기술정보통신부 2차관은 지난 15일 독파모 1차 평가 발표 브리핑에서 “최초 프로젝트를 설계했을 때 (선발) 과정을 참조해서 최대한 빨리 행정절차를 마무리할 예정”이라며 “임차된 GPU를 참여사에 제공하고 있는데 4개가 아닌 3개 기업만 평가에 임하게 될 경우 임차한 GPU 자원 휴면 문제가 발생한다”고 설명했다.
다만 정부 조치를 두고 업계에서는 의견이 엇갈리고 있다. 긍정적인 시선으로는 여타 기업에서 새로운 기회를 잡을 수 있게 됐다는 평가와 더불어 ‘행정 자원 효율적 운영’이라는 정부 취지를 이해한다는 시각이 있다.
반대로 형평성 측면에서 문제가 될 수 있다는 지적도 나온다. 당초 계획된 평가 방식은 단계별로 1개 정예팀을 탈락시키는 이른바 ‘데스매치’ 형식이었다. 계획에도 없는 패자부활전를 도입하는 것은 공정하지 않다는 지적이다.
특히 2차 단계에 진출한 LG AI 연구원과 SK텔레콤, 업스테이지 입장에서 4번째 정예팀은 ‘특별한 기회에 편승한 경쟁자’로 인식될 수 있다. 선발 방식이나 기준은 같을지 몰라도 5개팀이 치열하게 맞붙은 1차 평가때보다는 쉽게 관문을 통과한 셈이기 때문이다.
선발 예정인 4번째 기업 입장에서도 부담이 크다. 특혜를 받고 선정됐다는 시선에서 자유로울 수 없다. 더구나 6개월 앞서 정예팀 경쟁에 돌입한 3개팀보다 시간적으로 여유가 부족하다. 정부에서 1차전 평가 결과와 독립적으로 2차 평가를 진행하겠다고 밝혔으나 1차 평가에서 이미 AI 모델 개발을 완료한 정예팀과 격차는 상당할 수밖에 없는 현실이다.
업계에서도 이번 추가 정예팀 선발에 대한 시선이 싸늘하다. 2차 단계 진출이 좌절된 네이버클라우드와 엔씨 AI는 재도전을 고려하고 있지 않다는 입장을 밝혔다. 정부에서는 “모티프테크놀로지스나 KT 등 1차 평가 과정에 진출하지 못한 기업에게도 기회가 열렸다”고 설명했다. 이 가운데 KT는 “(재도전을) 검토한 바 없다”고 밝혔다.
한 AI 업계 관계자는 “일관되지 않은 평가 방식은 공정성 문제를 수반할 수밖에 없다”며 “예기치 못하게 3개 팀이 선정됐으면 이들에게 자원을 집중해주던지 혹은 특화 파운데이션 모델 사업으로 자원을 환원하는 등 방법이 더 효율적일 것이라는 의견이 지배적”이라고 말했다.
◆“벤치마크보단 사용성 중심 평가 이뤄져야”
정부는 2차 평가 방식도 1차 평가 방식과 큰 틀에서 차이가 없을 것이라고 밝혔다. 1차 평가는 ‘벤치마크 점수’ ‘전문가 평가’ ‘사용자 평가’ 세가지 측면에서 진행됐다. 먼저 벤치마크 점수는 글로벌 주요 AI 모델 벤치마크 점수를 기반으로 평가가 진행된다.
전문가 평가는 IITP 및 TTA 등 평가기관이 구성한 전문가 평가 위원이 맡는다. 사용자 평가는 실제 AI 업계 현업자들에게 독파모를 제공하고 실제 사용 경험과 활용성을 살펴본다.
김경만 과기정통부 인공지능정책실장은 지난 1차 평가 결과 발표 브리핑에서 “평가 기준은 평가를 받는 업체와 협의를 하면서 만들어왔다”며 “(2차 평가 기준도) 세가지 큰 틀에서 변화는 없을 것”이라고 설명했다.
업계에서는 2차 평가에서는 세번째 기준인 사용자 평가 비중이 커져야 한다고 입을 모으고 있다. 독파모 프로젝트 취지는 국내 전 국민·산업군이 폭 넓게 활용할 수 있는 기초(파운데이션)모델을 만드는 것이다. 따라서 글로벌 벤치마크도 일정 부분 평가 참고 지표는 될 수 있지만 핵심이 돼야 하는 것은 현업 사용자들이 직접 운영해보는 사용자 평가 비중이 높아야 한다는 주장이다.
독파모는 향후 금융·제조·유통 등 국내 유력 산업 분야에 적용되는 특화 모델의 근간이 될 예정이다. 따라서 각 분야 AI 관련 현업자들이 직접 사용한 이후 평가하는 사용성·활용성 평가가 핵심 판단 기준이 돼야 한다는 목소리다. 또 사용성 평가가 중요한 만큼 평가 내용과 결과를 투명하게 공개하는 것이 중요하다는 의견도 뒤따른다.
또 다른 AI 업계 전문가는 “결국 현장에서 직접 독파모를 기반으로 특화모델을 개발하고 활용하게 될 현업 전문가 평가가 제일 중요하다”며 “평가 내용을 투명하게 공개해 실제 현업자들이 살펴볼 수 있도록 해 보다 활발한 연구와 논의가 진행될 수 있도록 유도하는 과정도 필요하다”고 제언했다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
신선한1A우유
2.3L 1개














