한국연구재단 “A3 Foresight Program” 신규과제 선정_AI 기반 고압축 메타데이터 중심의 고대역 분산 HPC 환경 구축 연구
크레오넷관리자 View 24,070 2024-09-05
A3 Foresight Program은 한국연구재단의 연구자교류 과제로서 특정 연구분야에 대해 한․중․일 3국이 공동의 연구팀을 구성하여 추진하는 국제공동연구과제로서 한국의 NRF, 중국의 NSFC, 일본의 JSPS가 공동 승인하는 과제이다. 이번 2024년 과제 공모에서 한국측은 KISTI(과제책임자:문정훈)가 최종 선정되었다. 2024년은 “New Generation Databases and Data-Empowering Technologies”의 주제 아래 한.중.일 공동 파트너들은 총괄과제명 “Data Sharing Infrastructure across Northeast-Asia Supercomputing Centers for Open Science”를 중심으로 한국은 “AI 기반 고압축 메타데이터 중심의 고대역 분산 HPC 환경 구축 연구”로 향후 5년간 추진된다.
이번 과제의 내용은 연구데이터의 활용과 공유를 위한 첨단 연구환경(시스템 및 요소기술) 개발을 주도하고, 한국, 중국, 일본 간 첨단 연구데이터 공유 인프라 구축을 목적으로 한다. 대규모 과학 빅데이터는 이미 글로벌 협업 연구의 기본이 되었고, 최근에는 고대역 분산 HPC 환경의 발전과 대규모 언어 모델을 통한 과학기술의 한계 없는 발전이 진행되고 있으며, 과학분야에서는 오픈사이언스를 통해 경계 없는 과학기술의 발전이 매우 중요해지고 있다. 그러나 최근까지도 국제적(특히,한·중·일)으로 과학 빅데이터 활용을 위한 인프라의 부재는 국제간 협업연구의 큰 장애가 되고 있으며, 글로벌 동향과 오픈사이언스 기반의 과학기술경쟁력 강화를 위해 본 연구는 오픈사이언스 기반의 데이터 인프라와 메타데이터 표준을 개선하여 참여 국가 간 원활한 데이터 공유 및 협력을 통해 연구역량 강화를 핵심 목표로 추진한다.
연구내용을 요약하면 A3 국가들의 전문성을 중심으로 4개의 기술분과로 구분하여 메인 기관과 서브 기관으로 구성하여 다음과 같이 수행된다.
1) Infrastructure Unit(슈퍼컴퓨터기반의 고성능 공유 파일시스템): 중국 항저우슈퍼컴센터의 주도와 한국과 일본의 협력으로 추진되며 국가 간 데이터 공유 요구 사항에 대한 기본연구를 수행하고, 데이터 공유 프로토타입을 구축한다.
2) Data Transfer Unit(고속 데이터 전송환경): 한국 KISTI의 주도와 중국, 일본의 협력으로 추진되며, 빅데이터의 전송과 고성능 컴퓨팅 자원의 연계를 추진한다.
3) Data Compress Unit(데이터 압축 기술): 일본 RIKEN의 주도로 연구되며, 한국의 협력을 통해 인공지능 기술 기반의 최적화 알고리즘을 연구하고, 이를 통하여 압축 기법의 고도화기술 개발로 빠르고 효율적인 데이터의 전송과 공유 환경을 구축한다.
4) Metadata Unit(효율적인 메타데이터 관리): 일본 오사카 대학의 주도와 중국의 협력으로 추진되며, 한·중·일 간의 오픈사이언스를 위한 국제규약인 FAIR(Findable, Accessible, Interoperable, Reusable) 원칙을 지원하는 연구 데이터 검색을 위한 학제 간 모델을 개발한다.
본 과제의 목표는 단일 슈퍼컴퓨터센터와 데이터센터에서 처리할 수 없는 과학 빅데이터를 메타테이터화하고, 인공지능 기반 고압축 기술과 분산된 고성능 실험·계산 자원들과 연계를 통하여 오픈사이언스를 위한 고도화된 연구 환경 제공을 목표로 한다.
그림1. 과제 구성도