About

KRDC는 국가 연구데이터 공유·활용 극대화를 위한 연구데이터와 컴퓨팅 리소스 연합 활용 체계

연구데이터 커먼즈(Research Data Commons) 란

연구데이터 활용 극대화를 위해 상호 운용 가능한 고품질의 컴퓨팅 리소스에 원활한 사용성*을 제공하는 신뢰할 수 있는 공통(Common) 활용 체계로, 연구데이터와 컴퓨팅 리소스**의 연합 활용 체계임
  • * 사용성: 원활한 액세스, 표준 FAIR 원칙, 연구 과정에 생산된 연구데이터 및 디지털 개체에 대한 신뢰 가능한 재사용 등을 제공
  • ** 컴퓨팅 리소스: OpenAPI, 웹서비스, 가상 머신, 데이터 저장소, 클라우드, 슈퍼컴퓨터 등 공유 가능한 분석 도구 및 컴퓨팅 인프라 자원

KRDC 배경 및 필요성

「혁신성장 촉진을 위한 연구데이터 공유·활용 전략」(‘18.1, 국과심) 기반, 법·제도* 및 연구데이터 플랫폼, 바이오·소재 전문센터 구축 중임 * 공동관리규정(’19.9), 국가연구개발특별법의 국가연구개발정보처리기준(‘21.1) 등에 연구데이터 및 DMP 등의 법제도 조항 신설
  • 국가 연구데이터 플랫폼(DataON) 구축(‘20.1) 및 운영 중임(KISTI)
  • 바이오 데이터 스테이션(‘20~‘23, 연 95억) 및 소재 연구데이터 플랫폼(‘21~‘28, 연 33억) 구축 진행(KISTI)
  • 24개 출연(연) DMP 규정 적용 진행(완료 20개, 진행 4개), 13개 출연(연) 주요사업 DMP 적용(196개 과제)
  • 표준 연구데이터 저장관리 플랫폼(NaRDA)의 출연(연)(10개), 공공기관(9개) 무료 배포, 컨설팅 지원, DataON과 연계 추진
연구데이터의 수집·공유에 초점을 맞춘 플랫폼*은 개발 중이나, 분석·활용 체계는 분야·기관별 사일로(장벽)에 갇혀 공유·활용이 제한적 * DaraON, 바이오·소재 전문센터, 출연(연) 등
  • 연구데이터 수집·공유는 국내·외 플랫폼 간 연계를 통해 가능
  • 연구데이터 분석·활용을 위한 컴퓨팅 리소스는 DataON, 전문센터, 출연(연)이 개별적으로 구축 중임 ※ 출연(연)에서 DataON, 다른 출연(연)의 컴퓨팅 리소스(워크플로우, OpenAPI, 분석환경 등)를 사용하고자 하나, 연계 또는 공유할 표준 규약이나 체제 미비
  • 향후 추가적인 전문센터 구축 시, 공통적인 요소*의 중복 개발· 구축으로 인해 시간·예산 등 낭비 우려 * 연구데이터 수집·공유 플랫폼, 분석·활용을 위한 컴퓨팅 리소스 등
  • 전문센터가 구축되지 않은 분야의 연구원, 대학·기업의 연구자, 시민과학자 등은 편리한 연구데이터 및 컴퓨팅 리소스 활용이 어려움
해외의 경우, 연구데이터 활용 활성화를 위한 다양한 파일럿 시스템 구축 및 글로벌 연구데이터 커먼즈* 관련 표준화 활동을 통해 연구데이터의 활용에 초점을 맞춘 정책·개발 진행 중
  • * 연구데이터 커먼즈 : 연구데이터 활용 극대화를 위해 상호 운용 가능한 고품질의 컴퓨팅 리소스**에 원활한 사용성을 제공하는 신뢰할 수 있는 공통(Common) 체계로, 연구데이터와 컴퓨팅 리소스의 연합 활용 체계
  • * 컴퓨팅 리소스 : OpenAPI, 웹서비스 등 다양한 형태의 분석 알고리즘, 가상 머신, 데이터 저장소, 클라우드, 슈퍼컴퓨터 등의 공유 가능한 자원

추진과제 1

KRDC
포털 및 관리체계 구축
세부과제
  • KRDC 포털 및 운영체계 구축
  • KRDC 컴퓨팅 리소스 큐레이션 체계 구축
  • KRDC 컴퓨팅 리소스 저장 체계 구축
기능목록
  • 1. KRDC 포털 소개
  • 2. 사용자/제공자 관리
  • 3. 리소스 검색 /브라우징
  • 4. 제공자/리소스 대시보드
  • 5. 리소스데이터 수집/등록
  • 6. 리소스 연계
  • 7. 메타데이터표준화
  • 8. 리소스 저장
  • 9. 리소스 품질관리
  • 10. 리소스 보안관리

추진과제 2

KRDC
핵심 기술 개발
세부과제
  • KRDC 상호운용 기반 기술 개발
  • KRDC 표준프레임워크 기술 개발
  • KRDC 워크벤치 기술 개발
기능목록
  • 11. 인증권한관리기술
  • 12. 보안관리기술
  • 13. 리소스매트릭스분석
  • 14. 리소스성능운영모니터링
  • 15. 리소스개발표준프레임워크록
  • 16. 리소스개발프로토콜
  • 17. 리소스개발템플릿
  • 18. 리소스개발SDK
  • 19. 워크플로우기술
  • 20. 가상워크벤치기술

추진과제 3

KRDC
실증연구
세부과제
  • 마켓플레이스 플랫폼 개발
  • 융복합 R&D 실증 서비스
  • 테스트베드 구축 및 운영(H/W, VMs)
기능목록
  • 21. 마켓플레이스포털
  • 22. 과금모델정책,BM 수립
  • 23. 수요자/공급자 거래시스템
  • 24. KRDC커뮤니티서비스구축
  • 25. 융복합 커뮤니티 구축
  • 26. 실증 시나리오 및 사례 개발
  • 27. KRDC 개발/운영 환경
  • 28. 가상화테스트베드 구축
  • 29. 가상머신 배포 및 운영
  • 30. 서비스관리운영지침

최근 연구 분야별 장벽을 넘어 분산된 연구데이터 및 컴퓨팅 리소스 등을 연구자들이 공유 및 협업

국내는 연구데이터 수집·공유 관련 체계는 진행 중이나, 분석·활용을 위한 컴퓨팅 리소스의 원활한 공유·활용 체계 구축은 미비

최근 연구데이터의 공유를 넘어 활용 극대화를 위한 글로벌 연구데이터 커먼즈 관련 활동 및 사례가 다양하게 시도되고 있음

  • (글로벌 활동) 세계 최고의 데이터 관련 기구인 RDA RDA: Research Data Alliance, CODATA CODATA: Committee on Data for Science and Technology는 글로벌 연구데이터 관련 활동 분석을 통해 글로벌 커먼즈 구축 활동 시작 ※ RDA는 GORC GORC: Global Open Research Commons(‘21)를 통해 글로벌 표준 커먼즈 모델 개발을 목표로 활동 중이고,CODATA는 GOSC GOSC: Global Open Science Cloud(’19)를 통해 이를 기반으로 파일럿 시스템 구축을 목표로 활동 중
  • (개발 사례) 호주의 ARDC ARDC: Australian Research Data Commons, EU의 EOSC EOSC: European Open Science Cloud, 중국의 CSTCloud CSTCloud: China Science and Technology Cloud, 아프리카의 African OS Platform 등은 연구데이터의 공유·활용을 위한 오픈사이언스 관련 법·제도 및 기술 개발 진행 중
클라우드 기반 연구데이터
공유·활용 플랫폼 구축 필요성
  • 클라우드를 활용하여 데이터를 분석, 재사용할 수 있는 eResearch 협업 도구 및 인프라를 제공함으로써 연구 역량 및 경쟁력 향상에 기여
  • 클라우드·온라인 네트워크 기반 국내·해외 전국 규모의 연구 인프라 구축을 통해 연구자의 데스크톱에서 연구 프로세스 전 주기의 수행이 가능
  • European Open Science Cloud
    클라우드를 기반으로 연구 데이터의 저장, 관리, 분석 및
    재사용성을 가능하게 하는 가상 환경 제공을 위한
    프로젝트 연구중 (7년간 약 120조원 투자)
  • Australian Research Data Commons
    국가 차원의 연구데이터의 수집, 관리, 분석까지 이르는
    오픈 사이언스 활용체계 마련 및 제공
  • Global Open Sciences Cloud
    국가 차원의 연구데이터의 수집, 관리, 분석까지 이르는
    오픈 사이언스 활용체계 마련 및 제공
  • China Sciences and Technology Cloud
    국가플랫폼을 통해 연구데이터 공유와 관련 서비스들을
    과학자에게 효율적으로 제공하기 위한 공유·활용 체계를 구축 중

DataON을 통해 공유되는 연구데이터의 분야·기관별 장벽을 넘어 활용성 극대화

DataON, 전문센터 플랫폼, 출연(연) 연구데이터 플랫폼 등의 표준화된 컴퓨팅 리소스 연계활용 체계 구축

글로벌 표준 및 국내 요구사항 반영한 국가 연구데이터 커먼즈 체계 구축

RDA의 GORC, CODATA의 GOSC 등의 글로벌 표준화 활동 참여를 통한 글로벌 리더십 확보

연구자뿐만 아니라, 기업 연구자 및 시민과학자들도 사일로(장벽)를 넘어 분야·기관별 최고 수준의 컴퓨팅 리소스 활용 가능