KRDC는 국가 연구데이터 공유·활용 극대화를 위한 연구데이터와 컴퓨팅 리소스 연합 활용 체계임
연구데이터 커먼즈(Research Data Commons) 란
- 연구데이터 활용 극대화를 위해 상호 운용 가능한 고품질의 컴퓨팅 리소스에 원활한 사용성*을 제공하는 신뢰할 수 있는 공통(Common) 활용 체계로, 연구데이터와 컴퓨팅 리소스**의 연합 활용 체계임
-
- * 사용성: 원활한 액세스, 표준 FAIR 원칙, 연구 과정에 생산된 연구데이터 및 디지털 개체에 대한 신뢰 가능한 재사용 등을 제공
- ** 컴퓨팅 리소스: OpenAPI, 웹서비스, 가상 머신, 데이터 저장소, 클라우드, 슈퍼컴퓨터 등 공유 가능한 분석 도구 및 컴퓨팅 인프라 자원
KRDC 배경 및 필요성
- 「혁신성장 촉진을 위한 연구데이터 공유·활용 전략」(‘18.1, 국과심) 기반, 법·제도* 및 연구데이터 플랫폼, 바이오·소재 전문센터 구축 중임 * 공동관리규정(’19.9), 국가연구개발특별법의 국가연구개발정보처리기준(‘21.1) 등에 연구데이터 및 DMP 등의 법제도 조항 신설
-
- 국가 연구데이터 플랫폼(DataON) 구축(‘20.1) 및 운영 중임(KISTI)
- 바이오 데이터 스테이션(‘20~‘23, 연 95억) 및 소재 연구데이터 플랫폼(‘21~‘28, 연 33억) 구축 진행(KISTI)
- 24개 출연(연) DMP 규정 적용 진행(완료 20개, 진행 4개), 13개 출연(연) 주요사업 DMP 적용(196개 과제)
- 표준 연구데이터 저장관리 플랫폼(NaRDA)의 출연(연)(10개), 공공기관(9개) 무료 배포, 컨설팅 지원, DataON과 연계 추진
- 연구데이터의 수집·공유에 초점을 맞춘 플랫폼*은 개발 중이나, 분석·활용 체계는 분야·기관별 사일로(장벽)에 갇혀 공유·활용이 제한적 * DaraON, 바이오·소재 전문센터, 출연(연) 등
-
- 연구데이터 수집·공유는 국내·외 플랫폼 간 연계를 통해 가능
- 연구데이터 분석·활용을 위한 컴퓨팅 리소스는 DataON, 전문센터, 출연(연)이 개별적으로 구축 중임 ※ 출연(연)에서 DataON, 다른 출연(연)의 컴퓨팅 리소스(워크플로우, OpenAPI, 분석환경 등)를 사용하고자 하나, 연계 또는 공유할 표준 규약이나 체제 미비
- 향후 추가적인 전문센터 구축 시, 공통적인 요소*의 중복 개발· 구축으로 인해 시간·예산 등 낭비 우려 * 연구데이터 수집·공유 플랫폼, 분석·활용을 위한 컴퓨팅 리소스 등
- 전문센터가 구축되지 않은 분야의 연구원, 대학·기업의 연구자, 시민과학자 등은 편리한 연구데이터 및 컴퓨팅 리소스 활용이 어려움
- 해외의 경우, 연구데이터 활용 활성화를 위한 다양한 파일럿 시스템 구축 및 글로벌 연구데이터 커먼즈* 관련 표준화 활동을 통해 연구데이터의 활용에 초점을 맞춘 정책·개발 진행 중
-
- * 연구데이터 커먼즈 : 연구데이터 활용 극대화를 위해 상호 운용 가능한 고품질의 컴퓨팅 리소스**에 원활한 사용성을 제공하는 신뢰할 수 있는 공통(Common) 체계로, 연구데이터와 컴퓨팅 리소스의 연합 활용 체계
- * 컴퓨팅 리소스 : OpenAPI, 웹서비스 등 다양한 형태의 분석 알고리즘, 가상 머신, 데이터 저장소, 클라우드, 슈퍼컴퓨터 등의 공유 가능한 자원