Day_66 01. 데이터 구축 가이드라인 작성 기초
작성일
데이터 구축 가이드라인 작성 기초
가이드라인의 유형
주석을 위한 가이드라인은 필수!, 수집과 검수를 위한 가이드라인은 선택적
문서형 가이드라인 예시
한국어 학습자 말뭉치 구축 가이드라인
튜토리얼 가이드라인 예시
https://www.cashmission.com/cashmission_guide/53
가이드라인의 구성 요소
데이터 구축 목적 정의가 가장 중요!
데이터 구축 목적 정의 예시
작업자들의 작업에 대한 이해도를 높여 더 높은 품질의 데이터를 만들 수 있도록 돕는 역할
[인공지능 (AI) 학습용 데이터 품질관리 가이드라인 (v.1.0)] 한국지능정보사회진흥원 [인공지능 (AI) 학습용 데이터셋 구축 안내서] 한국지능정보사회진흥원
데이터 구축 가이드라인 용어 정의 예시
https://alt.qcri.org/semeval2016/task5/data/uploads/absa2016_annotationguidelines.pdf
데이터 수집 가이드라인 예시
https://kcorpus.korean.go.kr/boardFileDownload.data?seq=63
데이터 체계 제시 예시
https://kcorpus.korean.go.kr/boardFileDownload.data?seq=63
https://www.cis.upenn.edu/-bies/manuals/tagguide.pdf
데이터 구축 도구 사용법 예시
https://balsamiq.com/learn/articles/wireframe-annotations/
섬세하게 도구의 사용법을 알려주는게 좋음
가이드라인 버전 관리
가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함
개정 전과 개정 후 어떤 것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는 것이 가장 좋음
버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨
가이드라인 작성 도구
Google Docs
공유가 자유롭고 중간중간 자동으로 저장이 됨
가이드라인 초안을 작성할 때 좋음
Notion
제일 추천하는 도구임
워드 및 한글
정부사업을 하는 경우는 한글이 기본
그외
레이블링 에이전시에서 제공하는 도구
위키
등등
가이드라인 작성 시 유의 사항
가이드라인의 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.
작업자의 작업 이해도를 고려하여 작성한다.
작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.
가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.
작업자의 가독성을 고려한다.
꼭 필요한 정보만 넣기! 중요한 정보는 강조!
댓글남기기